SL02 EDP

1

1A

Nein, es gibt 2 observation types (participant info, experiment data)

1B

Observation 1 (participant info) besteht aus search_expert, topic_expretise und unique_participant, welchen man in die Spalten “ID”, “gender” und “occupation” aufteilen sollte. Diese extra infos über participants sollte man in einen extra dataframe auslagern und mit der ID referenzieren. Zu experiment data gehören die observations (duration_1, result_1…) und die jeweilige condition, sowie die ID um die Teilnehmer zu identifizieren.

1C

→ Anhang

2

2A

  • mean = 77.195
  • median = 72.5
  • variance = 269.45
  • standard deviation = 16.4

2B

2C

2D

Man sieht klar, dass die Zufriedenheit bei der condition “baseline” um einiges niedriger ist. Außerdem ist die Duration sehr viel höher, vermutlich ist deshalb die Zufriedenheit auch niedriger. Bei condition “featured” ist die duration um einiges niedrieger, außerdem ist die Zufriedenheit viel höher. Condition “featured” scheint also in beiderlei Hinsicht besser zu sein.

3

3.1.A

  • abhängige Variable: der Unterschied der Beantwortbarkeit
  • unabängige Variable: das System mit Baseline-Snippets

3.1.B

Chi-Square goodness of fit test

  • independent data ✅
  • categorical data ✅
  • sufficient data size (>5) ✅

3.1.C

Testing H3.0 (System unterscheidet sich nicht)

tidySERP = read.csv(file = 'tidySERP.csv')

can_answer_question <- tidySERP$can_answer_question

baseline_can_answer_question <- tidySERP[ which( tidySERP$condition<span class="text-highlight">"baseline") , ]
baseline_can_answer_question<-baseline_can_answer_question$can_answer_question
baseline_can_answer_question<-data.frame(baseline_can_answer_question)

featured_can_answer_question <- tidySERP[ which( tidySERP$condition</span>"featured") , ]
featured_can_answer_question<-featured_can_answer_question$can_answer_question
featured_can_answer_question<-data.frame(featured_can_answer_question)

chisq.test(baseline_can_answer_question$baseline_can_answer_question, featured_can_answer_question$featured_can_answer_question)

X-squared = 0.0020819, df = 1, p-value = 0.9636

→ not significant → H3.1 ist wahr

3.1.d

H0: Das System mit Baseline-Snippets unterscheidet sich hinsichtlich der Beantwortbarkeit der Fragen vom System mit Featured Snippets H1: Das System mit Baseline-Snippets unterscheidet sich nicht hinsichtlich der Beantwortbarkeit der Fragen vom System mit Featured Snippets

Mit hilfe des chi-squared goodness of fit tests konnte die Grundhypothese H0 widerlegt werden, da der der chi-squared Wert sehr niedrig ist. Ein niedriger chi-squared Wert bedeutet, dass die beiden Datensätze sich sehr ähnlich sind. Der P-Value des Chi-Squared Tests ist außerdem nicht signifikant, deshalb muss die H1 Hypothese abgelehnt werden.

3.2.a

H0: Das System mit Baseline-Snippets unterscheidet sich nicht hinsichtlich der für die Aufgaben benötigten Dauer vom System mit Featured-Snippets

H1: Das System mit Baseline-Snippets unterscheidet sich hinsichtlich der für die Aufgaben benötigten Dauer vom System mit Featured-Snippets

3.2.b

Students t-test requirements:

  • normality (shapiro test p value of 2.072e-15) ✅
  • homogeneity of variance (p value of f-test = 1.561278e-13) ✅
  • independence ✅

3.2.c

tidySERP = read.csv(file = 'tidySERP.csv')
t.test(tidySERP$time~tidySERP$condition, conf=0.95, var.equal = TRUE, paired=F)

Result:

p-value of H1 = 2.2e-16

95 percent confidence interval:
-31.50522 -29.01478
sample estimates:
mean of x mean of y 
   62.065    92.325 

3.2.d

Der Students t-test wurde gewählt, da es sich um kontinuierliche Daten handelt und alle Voraussetzungen für den Test erfüllt wurden. Die Testergebnisse zeigen, dass die Hypothese H1 mit einem P-Value von 2.2e-16 extrem signifikant ist und daher angenommen werden muss.