Strona używa cookies (ciasteczek). Dowiedz się więcej o celu ich używania i zmianach ustawień. Korzystając ze strony wyrażasz zgodę na używanie cookies, zgodnie z aktualnymi ustawieniami przeglądarki.    X

Korelacja: sprzedaż czasopism - jakość "pełniaków" ?

W tym wpisie chciałbym, z czystej ciekawości sprawdzić, czy istnieje jakakolwiek korelacja pomiędzy sprzedażą czasopism, a atrakcyjnością (ocenami) pełniaków zawartych w nich.

Do "badania" wziąłem dwa czasopisma: CD Action oraz PLAY!. Oba będąc w Związku Kontroli Dystrybucji Prasy udostępniają ilość sprzedanych egzemplarzy. Dodatkowo, dzięki temu, iż są to magazyny o grach, łatwiej będzie sprawdzić oceny gier, niż gdyby były to czasopisma o oprogramowaniu.

Coś ze statystyki

Aby nie przedłużać i nie przynudzać wstępu o statystyce, krótko przedstawię pewne podstawowe pojęcia, pomocne w analizie tekstu (aczkolwiek nieobowiązkowe!).

Korelacja - siła zależność między zmiennymi
Współczynnik korelacji Pearsona p - znormalizowana miara (-1,1) określająca siłę korelacji; -1,1 - ścisła korelacja, 0 - brak korelacji.
Do obliczenia współczynnika korelacji p, potrzebna jest znajomość dwuwymiarowego rozkładu badanych cech dla danej populacji, a takich danych najczęściej nie posiadamy. Skutkiem tego jest, to iż korzystamy z estymatora r do oszacowania p , będącego współczynnikiem korelacji z próby.
Z racji tego, iż próba nie jest duża, skorzystamy z rozkładu t Studenta ("uproszczony", bardzo popularny rozkład różnych statystyk, wyniki sprawdzamy w gotowej tabeli).
Korzystając z t Studenta, ustalamy określony poziom istotności a (max. prawdopodobieństwo popełnienia błędu 1. rodzaju - odrzucenie hipotezy prawdziwej - (głównej)).
Hipotezy - szukając korelacji, w teorii sprawdzamy dwie hipotezy tzw. zerową i alternatywną. Zerowa w danym przypadku mówi o braku korelacji, zaś alternatywna o istnieniu powiązania. Odrzucenie hipotezy zerowej, skutkuje przyjęciem hipotezy alternatywnej.

Odrzucenie lub przyjęcie hipotezy, uzależniamy od wyliczonego t Studenta porównując go, z wartością ta - z tablicy t Studenta:| t | >= ta - odrzucamy hipotezę H0| t | < ta - brak podstaw do odrzucenia hipotezy H0

Tak to wygląda "na sucho". Po więcej zapraszam do genialnej książki "Statystyka matematyczna modele i zadania" - Jerzy Greń oraz na wikipedię ;) .

Sprzedaż

Na początek, wyniki sprzedaży. Nikogo nie powinny zdziwić statystyki. CD Action od lat jest liderem prasy o grach, PLAY! ociera się już o granice wypłacalności. CD Action jest bardziej miarodajny niż PLAY!, które zostało wzięte do obliczeń jedynie jako ciekawostka i jako możliwość porównania danych ze statystykami CD Action. Dodatkowo PLAY! funduje czytelnikom prócz gier, które pochodzą "znikąd", to jeszcze często mają "czyszczenie magazynów" (pełne wersje gier z poprzednich miesięcy). Wiadomo, iż nie sprzyja to zwiększeniu sprzedaży.

Wykres nr 1

Już teraz (w ramach rozgrzewki), można sprawdzić czy sprzedaż CD Action jest związana ze sprzedaży PLAY!?

Do dzieła:

H0 - hipoteza zerowa, brak korelacji między cechami (sprzedaż CD Action, a sprzedaż PLAY!), dalej oznaczać będziemy jako p = 0H1- hipoteza alternatywna, istnienie korelacji między cechami (sprzedaż CD Action, a sprzedaż PLAY!), dalej oznaczać będziemy jako p != 0

Poziom istotności ustalamy na a = 0,05.

Korzystając z Excela (funkcja PEARSON, wzór ), obliczamy estymator rr = 0,28 Z racji małej próby (n = 16 miesięcy), obliczamy wartość statystyki t Studenta:t = (r/sqrt(1-r^2)*)sqrt(n-2) = 1,07wartość ta odczytana z tablic t Studenta (a = 0,05; a = 14 ) to: 2,14479|t| = 1,07 < 2,14479 = ta - brak podstaw do odrzucenia hipotezy H0.

Podsumowując, nie wykryto zależności pomiędzy sprzedażą CD Action, a PLAY! (co widać na wykresie; wiadomo ćwiczenie na początek :P )

Pełniaki

Z owych 16 miesięcy wylistowałem pełne wersje gier, jakie były umieszczone w CD Action i PLAY!.
Problemem, mimo wszystko, okazała się ocena gier. Odpada szukanie pojedynczych recenzji i wyliczanie średniej. Również, oparcie się na jednej z większych polskich encyklopedii gier, nie było dobrym pomysłem (wiele słabych gier, ma zawyżone średnie). Wybór padł na http://www.metacritic.com/. Strona zbiera recenzje i wylicza średnią (wykorzystywana jest np. na Steamie). Niestety nie wszystkie gry mają oceny, a niektóre gry nie figurują nawet w bazie. Mimo wszystko uznałem, iż lepszego wyjścia na chwilę obecną szybko nie znajdę.

Oto lista gier z ocenami w nawiasach:

CD Action

sty-10 Watchmen: The End Is Nigh Part 1 (61), RollerCoaster 3 GOLD (81)
lut-10 Ninja Blade (61), So Blonde, Imperium Romanum (63)
mar-10 World of Goo (90), The Moment of Silence (70), Watchmen: The End Is Nigh Part 2 (44)
kwi-10 Blacksite: Area 51 (60), Drakensang: The Dark Eye (75), The Legend of Beowulf, DSJ 2
maj-10 Just Cause (75), Gwiezdne Wilki 2, Runes of Magic (71), Championship Manager 2008 (68)
cze-10 Act of War: Direct Action (82), Barrow Hill (65), Brothers in Arms: Road To Hill 30 (87)
lip-10 Ghost Recon Advanced Warfighter (80), Battlestations: Midway (76), Ford Racing 3
sie-10 Conflict: Denied Ops (58), Piraci Nowego Świata 2 (48), SBK 09 (71)
wrz-10 Tom Clancy’s Rainbow Six Vegas (85), Hitman Trylogia (73, 87, 74), Ford Racing Off Road (39)
paź-10 King’s Bounty: Legend (79), Cryostasis (69), Darkness Within: In Pursuit of Loath Nolder (52)
lis-10 Dark Messiah of Might and Magic (72), Necro Vision (63), Sublustrum (63)
gru-10 Tomb Raider: Legend (82), Lost Via Domus (52)
sty-11 Kane & Lynch: Dead Men (67), Resident Evil 4 (76)
lut-11 Tomb Raider: Anniversary (83), Devil May Cry 3 (66)
mar-11 Braid (90), SBK X (73), Thief Trylogia (92, 85, 87)
kwi-11 Call of Juarez: Bound in Blood (78), Bionic Commando (69), Shaun White Snowboarding (60), Allods Online (69)

PLAY!

sty-10 Tension (77), Tecno: The Base, Valkyrie: Ascension to the Throne
lut-10 Czyszczenie magazynów! :/mar-10 9th Company, Shadowgrounds (74), Kurka w ogniu
kwi-10 Czyszczenie magazynów! :/maj-10 Arcanum (81), Clutch (51), Outpost Kaloki, Runes of Magic (71)
cze-10 Czyszczenie magazynów! :/lip-10 Gothic 3 (63), Velvet Assassin, The Path (61), Runes Of Magic (71)
sie-10 Planescape Torment (91), Alliance: Globalny konflikt (43), Shadowgrounds Survivors (79)
wrz-10 Infernal (61), Ceville (73), German Truck Simulator
paź-10 Venetica (61), Chrome (73), Spells of Gold
lis-10 Zeno Clash (77), Adrenalin
gru-10 Czyszczenie magazynów! :/sty-11 X-Blades (54), Chrome (62), Super Stunt Spectacular
lut-11 Vampire Hunters, Age of Pirates (56), Penumbra: Czarna Plaga (78)
mar-11 Trine (80), Alpha Prime (59), Vivisector
kwi-11 Warfare, Steam Slug, Grupa Błyskawicznego Reagowania

Dane odnośnie ocen pełnych wersji zamieszczonych w PLAY! nie nadają się zbytnio do analizy. Częste "czyszczenie magazynów" oraz mało znane gry, uniemożliwiają wiarygodną analizę korelacji. Mimo wszystko, zebrane dane umieściłem na wykresach z danymi CD Action.

Pełniaki - średnia ocen pełnych wersji

Przystępujemy do ciekawszych obliczeń :)
Na podstawie zebranych danych sprawdzimy, czy istnieje zależność pomiędzy sprzedażą CD Action, a pełnymi grami dorzucanymi do czasopisma (średnie oceny z każdego miesiąca)?

Na wykresie nr 2 przedstawiono średnie oceny z pełnych wersji gier.
Dla ciekawości dodam, że średnia z całego okresu 16 miesięcy wynosi 70.

H0 - hipoteza zerowa, brak korelacji między cechami (sprzedaż CD Action, a średnia ocena pełnych wersji gier), p = 0H1- hipoteza alternatywna, istnienie korelacji między cechami (sprzedaż CD Action, a średnia ocena pełnych wersji gier), p != 0

Poziom istotności ustalamy na a = 0,05.
obliczamy estymator rr = -0,40 obliczamy wartość statystyki t Studenta:t = (r/sqrt(1-r^2)*)sqrt(n-2) = -1,65wartość ta odczytana z tablic t Studenta (a = 0,05; a = 14 ) to: 2,14479|t| = 1,65 < 2,14479 = ta - brak podstaw do odrzucenia hipotezy H0.

Podsumowując, nie wykryto zależności pomiędzy sprzedażą CD Action, a średnią ocena pełnych wersji gier

Wykres nr 2 / Wykres nr 3

Pełniaki - mediana ocen pełnych wersji

Bardzo podobny punkt, jak poprzedni, jedynie zamiast obliczać średnią ocen gier z miesiąca, obliczamy medianę. A zatem: czy istnieje zależność pomiędzy sprzedażą CD Action, a pełnymi grami dorzucanymi do czasopisma (mediana oceny z każdego miesiąca)?

Dane przedstawione na wykresie nr 3, mediana z całego roku wynosi: 71.

H0 - hipoteza zerowa, brak korelacji między cechami (sprzedaż CD Action, a mediana ocen pełnych wersji gier), p = 0H1- hipoteza alternatywna, istnienie korelacji między cechami (sprzedaż CD Action, a mediana ocen pełnych wersji gier), p != 0

Poziom istotności ustalamy na a = 0,05.
obliczamy estymator rr = -0,38 obliczamy wartość statystyki t Studenta:t = (r/sqrt(1-r^2)*)sqrt(n-2) = -1,52wartość ta odczytana z tablic t Studenta (a = 0,05; a = 14 ) to: 2,14479|t| = 1,52 < 2,14479 = ta - brak podstaw do odrzucenia hipotezy H0.

Podsumowując, nie wykryto zależności pomiędzy sprzedażą CD Action, a medianą ocen pełnych wersji gier (można było się spodziewać, analizując średnią ocen i wykresy dla obu statystyk (wykres nr 2 i 3))

Pełniaki - pełna wersja z najwyższą oceną za dany miesiąc

Na koniec sprawdzamy: czy istnieje zależność pomiędzy sprzedażą CD Action, a pełnymi grami dorzucanymi do czasopisma (maksymalna (najwyższa) ocena z każdego miesiąca)

H0 - hipoteza zerowa, brak korelacji między cechami (sprzedaż CD Action, a najwyższa ocena pełnej wersji), p = 0H1- hipoteza alternatywna, istnienie korelacji między cechami (sprzedaż CD Action, a najwyższa ocena pełnej wersji)), p != 0

Poziom istotności ustalamy na a = 0,05.
obliczamy estymator rr = -0,60obliczamy wartość statystyki t Studenta:t = (r/sqrt(1-r^2)*)sqrt(n-2) = -2,80wartość ta odczytana z tablic t Studenta (a = 0,05; a = 14 ) to: 2,14479|t| = 2,80 > 2,14479 = ta - odrzucamy hipotezę H0, o braku korelacji.

Bingo! Trafiony zatopiony.
Podsumowując ten krok: możemy założyć, iż istnieje korelacja (powiązanie), pomiędzy sprzedażą magazynów z grami (na przykładzie CD Action), a najwyżej ocenianą grą z danego miesiąca.

Wykres nr 5 - przedstawia wykres dwóch cech: sprzedaż X ocena. Poprowadzono linie trendu. Widać, iż dla danych z maksymalną oceną, występuje korelacja.

Wykres nr 4 / Wykres nr 5

Najważniejsze - interpretacja

Obliczenia pokazały, iż na sprzedaż magazynów z pełnymi wersjami (w naszym przypadku CD Action) wpływ ma maksymalna ocena gry (najwyżej oceniana) z danego miesiąca.
UWAGA! Estymator korelacji otrzymaliśmy ze znakiem ujemnym! Co z tego wynika? Oznacza to, iż sprzedaż CD Action do najwyżej ocenionej gry, jest odwrotnie proporcjonalna! Czyli im w miesiącu pełna wersja gry, która ma najwyższą ocenę, jest lepsza, tym sprzedaż jest mniejsza!
Dziwne? Dane nie kłamią :) Nie jest to również nielogiczne.
Jeśli czasopismo zamieszcza pełną wersję gry, która posiada bardzo wysokie oceny, nie może zamieścić bardzo nowej gry, z przyczyn czysto ekonomicznych. A zatem, idąc dalej. Zamieszczenie takiej gry może okazać się strzałem w kolano. Gra która powinna napędzać sprzedaż nie robi tego. Dlaczego? Możliwe, iż ze względu na to, że jako gra mająca świetne oceny, została już kupiona wcześniej, właśnie z tego powodu, przez większą część graczy. Ci co jej nie kupili, sugerując się dobrymi ocenami, pożyczyli ją już wcześniej lub, niestety, zaopatrzyli się w piraty (co niestety jest nadal problemem).
(Patrz: sprzedaż (Wykres 1) / maksymalna ocena (Wykres nr 4) za miesiąc: marzec 2010, czerwiec 2010, grudzień 2010, marzec 2011 - dobre oceny maksymalne - słaba sprzedaż).

Co w takim razie dzieje się z drugiej strony?
Sprzedaż gier "średnich" (ale nie "kaszanek" jak w PLAY!) powoduje wzrost sprzedaży (patrz wykresy 1 i 4 za miesiąc: luty 2010, kwiecień 2010, styczeń 2011). Osoby kupujące gry nie chcą kupować podczas premiery średniaków, gdyż wolą wydać pieniądze na lepsze gry. Co za tym idzie. Widząc grę w czasopiśmie za mniejsze pieniądze z chęcią kupią coś, co może nie jest hitem (a może właśnie im się spodoba?), ale nie posiadają w swojej kolekcji.

Proszę zauważyć dwukrotny wzrost sprzedaży PLAY! w lipcu 2010, mimo średnich wyników. Powód? Ciekawe gry (The Path) lub sequele prawdziwych hitów (Gothic 3), ale mające średnie recenzje.

Obliczenia dały naprawdę ciekawe i, jak dla mnie, zaskakujące wyniki. Temat nie jest zamknięty. Już teraz, mam kilka pomysłów jak go rozwinąć. Dodanie większej ilości danych, nowe, bardziej miarodajne cechy do porównania.

Dane z magazynu PLAY! posłużyły jedynie do celów porównawczych na wykresach. Oceny nie różnią się może zbytnio od siebie (Wykres nr 2), ale w PLAY! część gier jest na tyle słaba, iż nie ma ocen. Zaś o "czyszczeniu magazynów" nawet nie wspomnę ;)

Wpis okazał się bardzo interesujący i pożyteczny(? :P). Zaznaczam, iż mogą gdzieś pojawić się błędy w obliczeniach/statystykach. Jeśli coś, piszcie śmiało. Dzięki temu wpisowi przypomniałem sobie czasy statystyki ze studiów i (jakkolwiek by to zabrzmiało) w sumie nieźle się bawiłem :D.

Pozdrawiam 

hobby inne

Komentarze

0 nowych
Ave5   8 #1 16.07.2011 12:38

Świetny wpis, przyjemnie się czytało, brawo :)

Ryan   15 #2 17.07.2011 00:00

Statystyka nie wychodzi z mody. ;) Propsy za średnie z Metacritic a nie GameRankings. :]

przemo_li   11 #3 17.07.2011 00:34

To może jeszcze by dodać exlucsivy do ogólnego obrazu (tzn. jeśli w gazecie jest recenzja/zapowiedź na wyłączność to czy ma to wpływ na sprzedaż).

deepone   10 #4 17.07.2011 01:33

Podobają mi się obliczenia, chociaż myślę, że do tego tak jak np przemo_li trochę za mało parametrów było ustalonych, ale gdyby tego nie uprościć to chyba książkę albo jakąś broszurę mógłbyś wydać z takimi obliczeniami.

djfoxer   18 #5 17.07.2011 12:11

@Ave5, @Ryan
Dzięki, wymagało to naprawdę dużo pracy, a nie jest to ten z tych wpisów, które powstają w 2h na kolanie :P

@przemo_li, @deepone
Byłoby z tym ciężko, ocenę exlucsivów jeszcze trudniej zmierzyć. Dodatkowo z racji tego, że jest to miesięcznik, dodanie exlucsiva w postaci np. recenzji, w dniu wydania może się okazać, iż nie jest on już exlucsivem ;)

Co nie zmienia faktu, iż w przyszłości postaram się o szerszy zakres danych (2009 i niżej). Może mając więcej danych, wyjdzie coś ciekawszego. Myślałem też o tym, ażeby porównać wiek dodawanych, gier. Czy np. lepiej dodać grę z wyższą oceną, ale starszą, czy z niższą ale nowszą itp.

Dzięki za sugestie :)


oprych   13 #6 17.07.2011 23:14

Jedno może głupie pytanie, ale uwzględniłeś przesunięcie wydań?
Nie wiem jak teraz, ale kiedyś CD-Action potrafił wydać numer styczniowy w listopadzie :) Ale zazwyczaj było miesięczne opóźnienie.
Czyli np. ilość egzemplarzy sprzedanych w lutym dotyczy numeru marcowego :)

Wiem że to głupie, ale widziałem na własne oczy uwaloną magisterkę przez taki błąd :)

  #7 17.07.2011 23:16

Ze tez chcialo ci sie to pisac i liczyc. Profesor od statystki matematycznej na mojej uczelni powiedzial nam kiedys: "Statystyka powie wam wszystko oprócz prawdy" :)

CZARNY15   4 #8 18.07.2011 01:56

CD-Action ma 13 numerów w roku. W tym roku w jednym z miesiąców będą aż dwa numery :)
Pozdrawia stały czytelnik CDA.

997   5 #9 18.07.2011 08:12

Nie czytałem dokładnie, raczej starałem się wyszukać jakieś błędy ale nic mi nie wpadło w oko ;) Gratulacje.

@oprych, zawsze można na początku założyć, że sprzedaż danego numeru np. 01/11 dotyczy miesiąca, w którym został wydany do sprzedaży, a 01/11 to jego np. tytuł, który nie jest ściśle związany z numerem.
Ale musiałoby to być zaznaczone na wstępie.
Poza tym, trzeba by dojść do informacji czy ten '13' numer nie jest klasyfikowany jako numer 'ekstra' poza dwunastoma normalnymi, wtedy nie wejdzie do próby i wszystko jest dobrze ;)

djfoxer   18 #10 18.07.2011 08:15

@oprych, @CZARNY15
Na początku musiałem, dokładnie przejrzeć dane z sprzedaży i porównać z pełnymi wersjami. Porównując dane zamieszczane na markolf.pl i wirtualnemedia.pl mogłem ustalić co i jak :P 13. numer nie był brany pod uwagę, gdyż nie znalazłem takowych danych :) Najczęściej dane publikuje się za dany miesiąc dla wszystkich czasopism łącznie. Widocznie numer 13. by tylko zaburzał dane :)

Oczywiście plan wydawniczy CD Action i PLAY! nie nakładają się idealnie, co nie zmienia faktu, iż dane są publikowane razem za dany miesiąc, z opóźnieniem ok. 3 miesięcznym od ukazania się numeru.

djfoxer   18 #11 18.07.2011 08:24

@997
Dokładnie tak jest z tym 13. jak piszesz. Jeszcze raz sprawdziłem i 13. jest jak numer ekstra i nie jest uwzględniany w opracowaniach.

command-dos   18 #12 18.07.2011 08:43

mnie to ciekawi, że w ogóle jest jakaś sprzedaż czasopism z grami - w czasach portali, gdzie recenzji jest pełno... Fakt, nie dostaniemy na nich "pełniaka" za 20zł, więc jest to chyba jedyny motor napędzający sprzedaż tych "gazetek"...

djfoxer   18 #13 18.07.2011 09:04

@command-dos
Trend jest ogólnie spadkowy. CD Action ma się w miarę dobrze mimo delikatnych spadków, ale inne czasopisma albo już ledwo zipią (PLAY!), albo od jakiegoś czasu już nie istnieją (CLICK!).

Co innego, że w sumie ostatnio jak zajrzałem do CDA to albo już wydoroślałem, albo to już nie te stare CDA. Zawsze czytanie zaczynałem od Action Redaction, wiec i tak zrobiłem. I co? Ledwo w sumie dwie strony i bez rewelacji. Może to przez ten sezon ogórkowy?

997   5 #14 18.07.2011 10:35

Ja ostatni raz CDA kupiłem jakieś 10 lat temu ;) Można w sumie im zrobić prognozę (pewnie mają już swoją) i zobaczyć jak to będzie z nimi za 10 lat. Tylko, że trzeba by zebrać dane najlepiej od początku istnienia pisma, albo chociaż od roku ze szczytem sprzedaży. W sumie ciekawe.