WO 2001/010331 A1, 29.01.2004. RU 2107942 C1, 27.03.1998. US 5694592 A, 02.12.1997. US 2003/0046389 A1, 06.03.2003. EP 1282051 A1, 05.02.2003.
Имя заявителя:
МАЙКРОСОФТ КОРПОРЕЙШН (US)
Изобретатели:
ЧЖАН Бэньюй (US) ЦЗЭН Хуа-Цзюнь (US) ЛИ Ли (US) НАДЖМ Тарек (US) МА Вэй-Ин (US) ЛИ Ин (US) ЧЭНЬ Чжэн (US)
Патентообладатели:
МАЙКРОСОФТ КОРПОРЕЙШН (US)
Приоритетные данные:
15.04.2004 US 10/826,162
Реферат
Изобретение относится к информационному анализу данных и, в частности, к проверке релевантности между терминами и содержанием веб-сайта. Изобретение позволяет находить ключевые слова, в большей степени релевантные содержанию веб-сайта. Находится содержание сайта из URL предложения. Вычисляется(ются) расширенный(ые) термин(ы), семантически и/или контекстуально связанный(ые) с термином(ами) предложения. Вычисляются измерения подобия содержания и расширенного подобия из соответствующих комбинаций термина(ов) предложения, содержания сайта и расширенных терминов. Определяются измерения подобия категории между расширенными терминами и содержанием сайта с учетом обучаемого классификатора подобия. Обучается обучаемый классификатор подобия из проанализированного содержания сайта, связанного с данными каталога. Определяется значение достоверности, обеспечивающее объективную меру релевантности между термином(ами) предложения и содержанием сайта, из измерений подобия содержания, расширенного подобия и подобия категории, оценивающих множество оценок подобия с учетом обучаемой модели классификатора релевантности. 4 н. и 37 з.п. ф-лы, 4 ил, 1 табл.