US 6167398 A, 26.12.2000. RU 2166211 С2, 27.04.2001. US 2003/0088397 A1, 08.05.2003. US 2003/0097353 А1, 22.05.2003. THORSTEN BRANTS, FRANCINE CHEN, AYMAN FARAHAT. A System for New Event Detection. Proceedings of the 26th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval; Toronto, Canada, 26 July-1August 2003, July 2003 (2003-07), pages 330-337, XP002334940 ACM Press, New York, NY, USA. YIMING YANG, JIAN ZHANG, JAIME CARBONELL, CHUN JIN. Topic-conditioned Novelty Detection. Proceedings of the 8th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining; Edmonton, Alberta, Canada, 23-26 July 2002, July 2002 (2002-07), pages 688-693, XP002334939 ACM Press, New York, NY, USA. JAMES ALLAN, RON PAPKA, VICTOR LAVRENKO. On-line New Event Detection and Tracking. Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, Melbourne, Australia, 24-28 August 1998, August 1998 (1998-08), pages 37-45, XP002334941 ACM Press, New York, NY, USA. EP 1378838 A1, 07.01.2004.
Имя заявителя:
МАЙКРОСОФТ КОРПОРЕЙШН (US)
Изобретатели:
ХОРВИТЦ Эрик Дж. (US) ГАБРИЛОВИЧ Евгений (US) ДЮМЕ Сьюзан Т. (US)
Патентообладатели:
МАЙКРОСОФТ КОРПОРЕЙШН (US)
Приоритетные данные:
02.03.2004 US 60/549,371 20.04.2004 US 10/827,729
Реферат
Представлена система и методика фильтрации временных потоков информации, таких как новостные описания, посредством статистических мер новизны информации. Различные методики могут быть применены к собственным разработанным потокам новостей или другим типам информации на основе информации, которую пользователь уже просмотрел. Предусмотрены способы анализа новизны информации наряду с системой, которая персонализирует и фильтрует информацию для пользователей посредством определения новизны описаний в контексте описаний, которые они уже просмотрели. Система использует алгоритмы анализа новизны, которые представляют статьи как набор слов и именованных объектных сущностей. Алгоритмы анализируют динамику между и внутри документов посредством рассмотрения того, как информация развивается со временем от статьи к статье, а также внутри отдельных статей. Технический результат - возможность упорядочивания новостных статей, чтобы каждая статья добавляла максимум информации по отношению к ранее представленным единицам информации. 3 н. и 11 з.п. ф-лы, 13 ил., 1 табл.