Programmation Flashcards

Eric Coissac (28 cards)

1
Q

Définir modèle

A

Représentation simplifiée de la réalité.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Définir moyenne

A

Somme des valeurs divisée par le nombre d’observation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Définir médiane

A

La valeur qui sépare les données en deux groupes de taille égale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Définir Variance

A

Mesure de la dispersion des valeurs autours de la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Définir corrélation

A

mesure la façon dont 2 variables varient ensemble.

Le coefficient de corrélation de Pearson, noté r, quantifie l’intensité du lien linéaire entre deux variables X et Y. Il varie entre –1 et +1.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Définir le coefficient de détermination R^2:

A

exprime la proportion de variance expliquée par le modèle linéaire.
R^2: compris entre 0 et 1.
Plus il est proche de 1, plus le modèle explique bien les données.

En gros il représente le pourcentage de variabilité de Y expliquée par X.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est ce que la SCT ?

A

Somme des carrés totales: mesure de la variabilité totale de Y autour de la moyenne.

SCT= SCM + SCR

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est ce que la SCR ?

A

Somme des carrés résiduelle: mesure de la variabilité non expliquée par le modèle.

Plus SCR est petit, meilleur est le modèle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est ce que la SCM ?

A

Somme des carrés expliquée:
mesure de la variabilité expliquée par le modèle (résidus).

Plus SCM est grand, plus la variable Y est expliquée par le modèle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est ce que la p-valeur ? Donner les 2 cas de déduction par rapport au risque alpha

A

la chance qu’on a de se tromper en rejettant H0.

Si p<0.05 : il y a une différence significative donc on rejette H0
Si p> 0.05: il n’y a pas de différence signicative donc on ne rejtte pas H0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est ce que le risque alpha ?

A

le risque (de 1ère espèce) de rejetter H0 à tort (alors qu’elle est vraie).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Théorème central limite

A

La somme de variables aléatoires tend toujours vers une distribution gaussienne (soit de loi normale).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

rnorm

A

fonction R qui génère aléatoirement des valeurs issues d’une loi normale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

c(v1, v2)

A

fonction concatenate, qui assemble, colle plusieurs vecteurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

rep()

A

fonction repeat, elle crée un vecteur où un élément est répété un certain nombre de fois.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

factor()

A

type d’objet pour représenter des variables qualitatives.
Il possède 2 éléments :
les valeurs “malee “female”
les niveaux : liste des modalités possibles.

17
Q

tibble()

A

tableau qui contient 2 colonnes.

18
Q

function

A

objet qui peut être stocké dans une variable (indique à R qu’on va créer une fonction)
les (): contient les arguments/paramètres
les {}: contient le code à éxécuter qu’on appelle fonction.

19
Q

mutate

A

on ajoute ou modifie une colonne

20
Q

group_by(x)

ungroup()

A

regroupe les données selon (x)

on retire le regroupement pour les calculs suivants.

21
Q

x

summarise()

A

résume le résultats

22
Q

boucle for

A

on répète le calcul un certain nombre de fois.
Ce n’est pas une fonction mais une instruction du langage.

23
Q

distr_r2

A

fonction qui sert à simuler plusieurs jeux de données et calculer la distribution empirique du R2.

24
Q

p_cumul

A

fonction qui calcule la probabilité cumulée d’une valeur observée dans la distribution simulée
elle répond à la question “ quelle fonction des valeurs simulées sous H0 sont <= à R2 observé.

25
centre()
calcule la position médiane entre 2 indices X et Y c'est un outil pour chercher au milieu d'un intervalle dans un tableau trié
26
chercher
sous fonction récursive; elle fait une recherche dichotomique pour trouver où se place la valeur observée dans le le vecteur choisi
27
c'est quoi une fonction
objet qui prend des entrées (arguments paramètres) effectue des calcules ou opération à l'intérieur et renvoi un résultat. Elle est stockée dans une variable = recette.
28
c'est quoi le principe de dichotomie
méthode qui permet de trouver rapidement une valeur dans un ensemble trié.