О количестве слов в кластере текста у Google
(Взято из группы Гугл http://groups.google.com/group/Network-Sociology. Автор Николай Петров)
А теперь представляю вашему вниманию аверетч (средний показатель), полученный от анализа количества слов в кластере текста.
Фругл при поиске выдает *15-18* слов, не считая заголовка конечно. О заголовках могу написать отдельный доклад. Гугл Ньюз выдает в среднем около
тридцатника (*30*). Гугловый поиск дает где-то *14-18* слов, я имею ввиду черный текст в результатах поиска, на который нельзя тыркнуть.
А теперь сядте в удобную позу, потрите в ладоши, предвосхищая сногсшибательную информацию о гугловой словестной кластеризации, и...
Сели?
Количество слов, появляющихся на строке сервиса Gmail при хорошем разрешении равно... *12-15*! Это включая от кого письмо, включая надписи от
ярлыков, и естевственно первые слова из текста самого письма.
Но мы на этом не остановимся, и при дальнейшем исследовании обнаружим, что в Google Reader размер текстового кластера составляет *25-35* слов.
Интересно, что это равно гугловским новостям. Т.е., чтобы наиболее адекватно воспринять факт или событие, недавно произошедшее в мире, нужно около 30
слов.
И на добивание обещанная информация о количестве слов в абзаце моего супер-словаря иностранных слов:
Барабанная дробь...
*12-28*!!!
...
Ну вот, все срастается!
Объем текстовой информации тоже можно разделить на три кластерные категории:
1 - *заголовки* ( от *1-2* до *5* слов)
2 - эффективные текстовые кластеры (от *12-15* до *25-35* слов)
3 - весь остальной многостраничный текст, в том числе Война и Мир (более *120* слов).
Итересно что рекламу в этой классификации делает тоже вторая группа, и вторая группа имеет наибольшее значение в получении бытовой (каждодневной) но принципиально важной информации.