Algoritam koji prepoznaje bestselere
ilustracija

Sigurnost od 84 odsto

Algoritam koji prepoznaje bestselere

Informatičarka Jedžin Čoi objavila kako je pronašla algoritam po kojem može, sa popriličnom sigurnošću, da se utvrdi hoće li neka knjiga postati hit među čitaocima.

Nakon analize sprovedene na 800 knjiga dostupnih na Projektu Gutenberg, Jedžin Čoi sa Univerziteta Stoni Bruk zaključila je da može sa sigurnošću od 84 odsto da zna ishod popularnosti nekog romana.

Sa saradnicima je podijelila knjige po vrstama i žanrovima. Prvo su analizirali umjetnički stil prvih hiljadu rečenica svake knjige i uporedili ih sa brojem preuzimanja proučavanih naslova sa interneta. Iz toga su izvukli zaključak koliko stil utiče na popularnost. Zaključili su da manje popularne knjige sadrže više glagola i priloga, kao i stranih riječi, a u prilog popularnosti nekog naslova ne ide ni učestalo korištenje klišea. Loše prolaze i oni koji često koriste opisne pojmove za emocije i akciju, a bolje se pozicioniraju izjavne formulacije rečenica.

Svoje zaključke primijenili su i na drugim knjigama, van Projekta Gutenberg, i sa istom tačnošću odredili uspjeh sedam od deset odabranih knjiga, a tu su se našli „Izgubljeni simbol“ Dena Brauna i „Starac i more“ Ernesta Hemingveja. Očekivali su probleme s analizom djela Hemingveja jer njihov sistem valorizuje djela prema složenosti sintaksičkih struktura, a poznato je da Hemingvejev rad odlikuje baš jednostavnost, ali do toga nije došlo.

Zanimljivo je i da su zaključili kako su čitljivost i nagrađivanost romana na suprotnim stranama.

Naučnici koji su se bavili ovim istraživanjem tvrde da je to prvo i za sada jedino koje se bazira na kvantitetu, a ne na kvalitativnim svojstvima napisanog, te da im je količina analiziranih knjiga garancija pouzdanosti metode. S njima se pretjerano ne slažu autori, izdavači i urednici koje je Gardijan (The Guardian) zamolio za mišljenje, jer oni prednost daju kvalitetu literature u odnosu na njen prodajni potencijal.