Tuossa vähän yli kuukausi sitten kirjoitin pitkän ja raskaslukuisen tekstin aiheesta, joka on kyllä jokapäiväinen, mutta ei kauhean kiinnostava. Tai niin ainakin kuvittelin.
Puhun nyt pyöräilyn väistämissäännöistä risteyksessä. Sysäyksenä tuohon toimi, kun päädyin toisessa blogissa komentoijien virhekäsityksiä oikoessani pohtimaan, kuinka monella eri tavalla pyörä ja auto voivatkaan kohdata tasa-arvoisessa risteyksessä. Ja niitä olikin aika monta, kuten tuppaa käymään valintapuun ollessa sekä leveä että syvä. Se oli sitten pakko kirjoittaa auki.
Pari viikkoa myöhemmin google-analyticsin käyrä näytti sitten tältä:
Kolmessa päivässä blogiin tuli 9000 käyntiä, enemmän kuin edellisen vuoden aikana yhteensä. Tähän mennessä tuo postaus on luettu (tai pikemminkin haettu ruudulle) 12000 kertaa. Ylivoimaisesti suurin lähde oli Facebook, toisena ilmeisesti IRC ja Twitter, sen jälkeen erilaiset keskustelupalstat fillarifoorumista hifiharrastajien kautta futisfoorumiin. Väistämissäännöistä tuli myös lyhyt pätkä telkkariin, jossa pääsin leikkimään törmäystestinukkea.
Kuten käppyrästä huomaa, netissä suosio on nopeaa, mutta lyhytaikaista. Se mitä sen sijaan ei huomaa, on että blogin lukijamäärä nousi melkein kolminkertaiseksi aiempaan nähden. Analyticsin pitäisi selvästi käyttää logaritmista asteikkoa.
Tämä ei ole mitenkään poikkeuksellinen kävijäkäyrän muoto. Olen nähnyt vastaavaa muuallakin, ja itse asiassa blogin aiempi hittiartikkeli, Kaupunkiautoilun hinta (toinen pitkä ja raskaslukuinen teksti, oletteko te lukijat hulluja?), toisti aivan samaa kuvioa, mutta kertaluokkaa pienemmin luvuin.
Nopeasti nouseva mutta lyhytaikainen suosio liittyy elimellisesti sosiaaliseen mediaan. Joskus ennen muinoin nörttien naiveissa kuvitelmissa linkki oli ikuinen viittaus asiasta A asiaan B ja kuvasti niiden välistä sisäsyntyistä yhteyttä. Ei enää. Nykyään linkit voisi luokitella:
- hetkellisiin, eli facebookkiin, twitteriin ym., joissa linkit käytännössä lakkaavat olemasta lyhyen ajan kuluttua,
- lyhytaikaisiin, kuten blogien ja foorumien postauksissa olevat linkit, jotka kyllä säilyvät olemassa, mutta joiden klikkausmäärä painottuu ensimmäisiin päiviin ja joidenkin viikkojen kuluttua lähenee nollaa, ja
- pysyvyyn, eli niihin perinteisiin linkkeihin jollain ”oikealla” nettisivulla. Niitäkin toki on, mutta vain pieni vähemmistö, ainakaan blogeihin viitatessa.
Internet elää nykyään hetkessä, ja sen huomio on lyhyempää kuin yläastelaisten serurustelusuhteet.
Suosion epätasainen jakauma, se että yksi postaus luetaan 12000 kertaa, toinen 700 ja muut korkeintaan joitakin satoja, sen sijaan ei liity vain sosiaaliseen mediaan, vaan sosiaalisiin verkostoihin ylipäänsä. Tälläiset jyrkän epätasaiset jakaumat tunnetaan yhteisnimellä power law (Pareto-jakauma, Zipf-jakauma, loglog-jakauma…), joka on tyypillinen kaikenlaisille sosiaalisille kuvioille kaupunkien koista näyttelijöiden palkkatasoon ja vapaiden koodiprojektien kehittäjämääriin. Sekä erinäisille muillekin ilmiöille.
Ilmiön taustalla on… tai siis, ilmiö on tapana mallintaa käyttäen skaalattomia verkkoja ja preferenssilinkittymistä (preferential attachement), jossa uuden solmun linkittyminen vanhoihin solmuihin perustuu jakaumaan, joka on suhteessa kullakin solmulla ennestään olevien linkkien määrään. Suomeksi esimerkin kautta siis: jokainen uusi euro osuu ihmisille siinä suhteessa, paljonko kenelläkin on rahaa; samalla todennäköisyydellä jokaisen olemassaolevan euron viereen. Jos minulla on miljoona ja sinulla kymppitonni, saan sata kertaa todennäköisemmin lisää. Ja kohta minulla onkin jo kaksi milliä kahtakyt tonniasi vastaan (tästä muuten nimi skaalaton: suhteet näyttävät samalta, vaikka määriä muutettaisiin kertaluokkia).
Paitsi että… ei itse asiassa ole mitenkään erikoisemmin todistettu, että läheskään kaikki nuo ilmiöt johtuisivat preferenssilinkittymisestä, tai edes että ne noudattaisivat power law -jakaumaa. Cosma Shalizi et al huomasivat, että useimmat power law jakaumilla selitetyt datasetit voi itse asiassa aivan yhtä hyvin selittää myös tavallisilla eksponentiaalisilla tai lognormaaleilla jakaumilla. Näiden erottelemiseen toisistaan tarvitsisi absurdin suuria aineistoja, joita ei yleensä ole saatavilla. Varsinainen paperi tässä.
Tällähän ei sinänsä pitäisi olla suurtakaan väliä: ainahan saman datan voi selittää monella eri funktiolla, ja jos tunnetaan ilmiön toimintamekanismi, riittää että saatu data voi/isi/ tulla siitä ilmiöstä. Ainoa vaan, että ainakin tietojenkäsittelijöillä tuntuu olevan usein suuria vaikeuksia hahmottaa, miten reaalimaailman ilmiöitä voi tai ei voi todistaa. Kuvitellaan, että kun on saatu jostain kasa dataa, joka voisi noudattaa käyrää X, oma suosikki-ilmiö, joka voisi generoida X muotoista dataa on sitten todistettu. Sivumennen sanoen samaa näkee myös ekonomeilla.
Ja se valtalaki, joka innoitti tuohon otsikon väärinsuomennokseen, on tietenkin 4.7.1917 valtalaki, jolla eduskunta julistautui korkeimman vallan haltijaksi. Sosialidemokraattien aloitteesta, ja lähinnä heidän äänillään, joskin porvaripuolueissa itsenäisyysmielinen vähemmistö äänesti myös puolesta. Vähän pilkkuja sorvaamalla sitä voidaan käytännössä pitää suomen ensimmäisenä itsenäistymisjulistuksena. Tai voitaisiin pitää, jos senaatti ei olisi jänistänyt ja hyväksynyt porvarien ja venäläisen kenraalikuvernöörin äänin Venäjän väliaikaisen (porvari)hallituksen käskykirjettä hajottaa eduskunta. Kirjettä, joka siis valtalain mukaan oli laiton.
Myöhemmät historian tapahtumat ovatkin sitten tutumpia. Seuraava eduskunta oli porvarienemmistöinen, ja lopulta julistautui 6.12. itsenäiseksi sosialistien sillä hetkellä hallitsemasta venäjästä, demarien äänestäessä vastaan. Eli sosialistit halusivat itsenäistyä porvarillisesta venäjästä, ja porvarit sosialistisesta venäjästä, mutta kummatkin nikottelivat päinvastaista. Asiaan kun liittyi kaikenlaisia näkökantoja…