Яндекс открыл доступ к справочной информации о людях, упоминаемых в СМИ

Яндекс открыл доступ к справочной информации о людях, упоминаемых в российских СМИ. Теперь при поиске в Яндекс.Новостях пользователи видят ссылки на «пресс-портреты» тех, чьи имена более всего соответствуют заданному запросу.Пресс-портреты создаются автоматически специальной компьютерной программой; исходным материалом служат сообщения от СМИ.

Каждый пресс-портрет содержит опубликованную в СМИ краткую информацию о человеке: сведения о местах работы и должностях, прямую речь и высказывания третьих лиц. Все сведения о персоналиях сопровождаются фрагментами документов, из которых они были извлечены; это позволяет быстро понять контекст и достоверность информации. По сути, пресс-портрет — это еще один вариант страницы результатов поиска по Яндекс.Новостям. Искать людей можно не только по фамилии (например, «Анатолий Чубайс» или «Остап Бендер»), но и по названию организации (например, «Microsoft») — в этом случае будут найдены все, кто, по сведениям СМИ, имеет или имел к ней отношение.

«Сегодня же мы начали применять технологии, которые позволяют не только определить, о ком идет речь в сюжете, но и дать справку по каждому участнику событий, — говорит Татьяна Платонова, руководитель службы Яндекс.Новости. — Пресс-портреты особенно полезны, когда СМИ пишут о тех, кто неизвестен широкой аудитории. Теперь за считанные секунды пользователь сможет разобраться, кто есть кто».

Новый сервис основан на уникальной технологии, принадлежащей компании «Яндекс». И извлечение фактов из текста, и группировка их в пресс-портрет (то есть определение, какие факты относятся к одному и тому же лицу) делается автоматически, без участия человека. «Впервые в России технология извлечения фактов (fact extraction) внедрена на массовом веб-сервисе и обрабатывает большие текстовые массивы. Назначение этой технологии — определять тождество различных обозначений одного объекта и различать объекты с одинаковыми именами, — говорит Лев Гершензон, ведущий разработчик компании Яндекс. — Мы научились автоматически связывать два типа объектов — людей и организации. Несмотря на то, что сейчас мы получили важный результат, информация о персонах может оказаться неполной и неточной, ведь пресс-портреты составляются компьютерной программой. Мы планируем дорабатывать технологию и с благодарностью примем любые отклики и предложения по повышению качества сервиса».

Подробнее о технологии (news.yandex.ru/people-search-tech.html)

[i][/i][i][/i]

Редакция
Оцените автора
BYBANNER.COM

Добавить комментарий