Надо отметить, что интерес к поисковым технологиям в мире устойчиво растет. Это объясняется инвестиционной привлекательностью этого технологического сектора. Примерами успешных ивестиций могут служить вливания в фирмы Inktomi и Google. С другой стороны, находясь на стыке компьютерных технологий, лингвистики и искусственного интеллекта поисковые системы являются полигоном отработки новых технологических решений, научных моделей и методов.
Попробуем разобраться во всей этой палитре красок, без эмоций и лишнего скепсиса, отделяя настоящие технологические новинки от рекламных трюков. Сегодня мы исследуем важную характеристику поисковых систем - набор функциональных возможностей поиска.
СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПО ФУНКЦИЯМ
Важной характеристикой любой поисковой системы (ПС) является её функциональный состав, т.е. тот набор функций и режимов, который поддерживает поисковая система(ПС).
Разделим все функции на три группы:
1 группа: функции, которые включены неявно или явно в основном режиме поиска и привязаны к ядру ПМ;
2 группа: функции, которые включены неявно или явно в основном режиме поиска и НЕ привязаны к ядру ПМ;
3 группа: функции, которые включены неявно или явно в режиме расширенного поиска.
Группу сервисных функций мы рассматривать не будем, так как она не имеет прямого отношения к качеству поиска, а определяет некоторые дополнительные возможности настройки ПС и удобство пользования ею.
Краткий сравнительный анализ по функциям, которые поддерживают ПС, приведен в таблице 1.
Пул поисковых систем и машин, выбранный для сравнения отражает представления автора о лидерстве в этой области Интернет-технологий. Яндекс был включен в этот список из тех соображений, что он является признанным национальным российским лидером среди ПС и было бы интересно увидеть как он выглядит в смысле функциональной наполненности на мировом фоне. Разумеется, что мы не можем сравнивать Яндекс и Google ни по объёму данных, ни по скорости их обработки в силу того простого обстоятельства, что база данных Яндекс отличается от БД Google почти на три порядка.
Таблица 1. Сравнительный анализ функций
|
ПС |
В поисковом ядре |
Вне ядра |
В расширенном поиске |
Всего функций |
В т.ч. уникальных |
|
Yahoo.com |
9 |
4 |
5 |
18 |
- |
|
Go.com |
15 |
3 |
5 |
23 |
2 |
|
Zapper.com |
5 |
7 |
- |
12 |
2 |
|
Altavista.com |
13 |
5 |
6 |
24 |
2 |
|
Google.com |
13 |
1 |
11 |
25 |
5 |
|
Fast.no |
7 |
- |
7 |
14 |
- |
|
Yandex.ru |
15 |
3 |
11 |
29 |
3 |
Все функции представлены в таблицах 2-4.
Таблица 2. Первая группа: функции, которые включены неявно или явно в основном режиме поиска и привязаны к ядру поисковой машины
|
Yahoo. Com |
Go. Com |
Zapper. Com |
Altavista. Com |
Google.com |
Fast.no |
Yandex.ru |
|
|
Морфология, словоизменение |
- |
+ |
- |
- |
- |
- |
+ |
|
Морфология, словообразование |
- |
- |
- |
- |
- |
- |
- |
|
Игнорирование верхнего/нижнего регистра |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
|
Поиск по идентификаторам |
+ |
+ |
+ |
+ |
+ |
+ |
+ |
|
Отображение онтологии (дерева категорий) |
+ |
+ |
- |
- |
+ |
- |
+ |
|
Проверенные находки (proven picks) |
- |
+ |
- |
- |
- |
- |
- |
|
Наилучшее совпадение (I’m feeling lucky) |
- |
- |
- |
- |
+ |
- |
- |
|
Выбор из списка словосочетаний |
+ |
+ |
- |
+ |
- |
- |
+ |
|
Список ключевых слов Интернета (A list of Internet Keywords) |
- |
- |
- |
+ |
- |
- |
- |
|
Сортировка (по дате, релевантности) |
+ |
+ |
- |
+ |
- |
- |
+ |
|
Язык запросов |
+ |
+! |
- |
+ |
+ |
(+/-) |
+! |
|
Поиск по списку слов |
+(AND) |
+(OR) |
+( AND) |
+(AND) |
+(AND) |
+(3 варианта) |
+(AND) |
|
Поиск по словосочетанию |
+ |
+ |
- |
+ |
+ |
+ |
+ |
|
Поиск в результатах запроса (явным образом) |
- |
+ |
- |
+ |
+ |
- |
+ |
|
Учет контекста выделенного текста |
- |
- |
+ |
- |
- |
- |
- |
|
Найти похожие (Similar, related) |
- |
- |
+ |
+ |
+ |
- |
+ |
|
Предлагает варианты написания |
- |
- |
- |
- |
+ |
- |
- |
|
Статистика по количеству категорий/ документов / сайтов / слов 6 |
+/-/+/- |
-/+/-/- |
-/-/-/- |
-/+/-/+ |
-/+/-/- |
-/+/-/- |
-/+/+/- |
|
Реконструкция текста (экрана) |
- |
- |
- |
- |
+ |
- |
+ |
|
Контекстная реклама |
- |
+ |
- |
- |
- |
- |
+ |
|
Выбор языка |
- |
- |
- |
+ (25 яз.) |
+ (26 яз.) |
+ (46 яз.) |
+ (2 яз.) |
|
Перевод запроса на другие языки |
- |
- |
- |
- |
- |
- |
- |
|
Перевод результатов поиска на другие языки |
- |
+ |
- |
+ (9 яз.) |
- |
- |
- |
|
Фокус поиска |
- |
+ |
- |
- |
- |
- |
- |
|
Поиск на карте |
- |
- |
- |
- |
+ |
- |
- |
|
Всего |
9 |
15 |
5 |
13 |
13 |
7 |
15 |
|
Yahoo. Com |
Go. Com |
Zapper. Com |
Altavista. Com |
Google.com |
Fast.no |
Yandex.ru |
|
Yahoo.com |
Go.com |
Zapper.com |
Altavista. com |
Google.com |
Fast.no |
Yandex.ru |
|
|
Поиск по товарам |
+/- |
+ |
+ |
+ |
- |
- |
+ |
|
Поиск по новостям |
+ |
+ |
+ |
+ |
- |
- |
+ |
|
Поиск по видам ресурсов (музыка, картинки) |
+/- |
+ |
+ |
+ |
- |
- |
+ |
|
Поиск по тематическим категориям (Directories) |
+ |
- |
+/- |
+ |
- |
- |
- |
|
Биржевые котировки фирм |
- |
- |
+ |
- |
+ |
- |
- |
|
Поддержка поиска по внешним к ПС ресурсам |
- |
- |
+(>100)
|
+(7-11) |
- |
- |
- |
|
Libraries, agents and packs |
- |
- |
+ |
- |
- |
- |
- |
|
Всего |
4 |
3 |
7 |
5 |
1 |
- |
3 |
|
Yahoo.com |
Go.com |
Zapper.com |
Altavista. com |
Google.com |
Fast.no |
Yandex.ru |
Таблица 4. Третья группа: функции, которые включены неявно или явно в режиме расширенного поиска
|
Функция |
Yahoo. com |
Go.com |
Zapper. com |
Altavista. com |
Google.com |
Fast.no |
Yandex |
|
И/ИЛИ/НЕ запросы |
+ |
+ |
- |
+ |
+ |
+ |
+ |
|
Поиск по фразе |
+ |
+ |
- |
+ |
+ |
+ |
+ |
|
Поиск в категориях |
+ |
- |
- |
- |
+ |
- |
- |
|
Сфера поиска (заголовки и т.д.) |
- |
+ |
- |
- |
+ |
+ |
+ |
|
Включить, исключить домен URL |
- |
+ |
- |
- |
+ |
+ |
- |
|
Слово сортировки |
- |
- |
- |
+ |
- |
- |
- |
|
Диапазон даты |
+ |
- |
- |
+ |
- |
- |
+ |
|
Язык |
- |
- |
- |
+ (25) |
+ (26) |
+ (46) |
+ (2) |
|
Формат, кол-во позиций на стр. |
+ |
+ |
- |
+ |
+ |
+ |
+ |
|
Фильтр |
- |
- |
- |
- |
+ |
+ |
+ |
|
Page-Specific Search (similar) |
- |
- |
- |
- |
+ |
- |
- |
|
Page-Specific Search (links to page) |
- |
- |
- |
- |
+ |
- |
+ |
|
Topic-Specific Search |
- |
- |
- |
- |
+ (5) |
- |
- |
|
Сайт/вершина |
- |
- |
- |
- |
- |
- |
+ |
|
Изображение |
- |
- |
- |
- |
- |
- |
+ |
| Спец.объекты (скрипт,объект, аплет,стиль) |
- |
- |
- |
- |
- |
- |
+ |
|
Всего |
5 |
5 |
0 |
6 |
11 |
7 |
11 |
|
Функция |
Yahoo. com |
Go.com |
Zapper.com |
Altavista. com |
Google.com |
Fast.no |
Yandex.ru |
Уникальные функции ПС это такие, которые представлены только на одной ПС из числа входящих в тестируемый пул. Они выделены серым цветом. Количество функций и тем более уникальных является одним из необходимых условий лидерства на рынке ПС и ПМ. Продолжение материала...