• В Беларуси
  • Наука
  • Интернет и связь
  • Гаджеты
  • Игры
  • Оружие
  • Архив новостей
    ПНВТСРЧТПТСБВС


IT.TUT.BY - информационные технологии в РБ
АВТОРИЗАЦИЯ
НОВОСТИ ИТ


Е. Колмановская, Яндекс: мы считаем, что сервисы должны быть быстрыми

1 ноября 2006 » Мир » Интернет
изображениеВ начале октября в Минске состоялась конференция «Деловой Интернет», участие в которой приняли представители многих известных российских IT-компаний. В их числе — сотрудники Яндекса. Журналисты издания "Мой Компьютер" встретились с Еленой Колмановской, главным редактором этой компании, и попросили ответить на несколько вопросов.
 
«Мой Компьютер»: Елена, добрый день. Вы впервые в Минске?

Елена Колмановская: Нет, впервые в Минске мы были 6 лет назад, и тоже в октябре. Тогда мы
приезжали, чтобы принять участие в первом белорусском интернет-фестивале Infobel-2000. Весь цвет белорусского Интернета тогда поместился в одном клубе.

Расскажите пожалуйста нашим читателям, с чего начался Яндекс?

Началось все с разработки технологии поиска по неструктурированным текстам с учетом морфологии русского языка, с помощью которой были созданы две специализированные информационно-поисковые системы - «Международная классификация изобретений» и «Классификатор товаров и услуг». Затем возникло желание применить технологию к каким-нибудь более популярным текстам. Так появился «Библейский компьютерный справочник» - благо, текст Библии не защищен копирайтом. Потом вместе с ИМЛИ (Институтом мировой литературы) мы работали над изданием «Классики на CD ROM». В результате было выпущено два диска: на одном — полное собрание сочинений Пушкина, а на втором — Грибоедова. Теперь этот проект размещен в Интернете на сайте http://feb-web.ru, где по-прежнему используется наша система поиска. А в 1996 году на выставке Netcom компания Comptek (тогда мы были ее подразделением) анонсировала первые продукты серии Яндекс. Среди них была Яndex.Server — программа для поиска по сайту. В 1997 году мы решили проиндексировать русский Интернет, чтобы продемонстрировать возможности нашей поисковой технологии. А позже оказалось, что это вовсе не реклама программы Яndex.Server, а настоящая самостоятельная жизнь со своей бизнес-моделью. Так в 2000 появилась компания Яндекс. Уже в 2002 году мы полностью самоокупились, даже получив 100 тыс. долларов прибыли. А в 2005 году у Яндекса доходы составили уже 35,6 млн. долларов, из которых более $13 млн. — чистой прибыли.

Что сегодня индексирует Яндекс?

В 1997 году велись споры о том, какой объем имеет русский Интернет — 5 или 7 гигабайт. Сегодня Яндекс индексирует более 28 Тб информации. Причем наши технические возможности позволяют восстановить этот индекс за пару недель (при условии, что ссылки на сайты сохранились). Объем Рунета вырос в несколько раз. Например, в 1997 году слово «женщина» фигурировало в поиске
Яндекса 27109 раз, а «мужчина» — 12610. А в этом году слово «женщина» искали 49 миллионов раз. При этом пропорция по отношению к результатам поиска слова «мужчина» составила 1,2. Сегодня изменилось также и соотношение по полу среди пользователей Интернета: и женщины, и мужчины практически одинаково часто посещают Всемирную сеть.

Сколько человек сейчас занято в системе компании Яндекс?

Более 400 человек. Всего 7 департаментов, самый большой из которых — департамент разработки, где работают в основном программисты.

Яндекс — это не только поисковый сервис?..

Поиск — это наш основной сервис и основной заработок. Причем поиск не только по веб-документам, но и по специализированным массивам данных: новостям, товарам, музыке, словарям, картинкам, адресам, картам, блогам. Конечно, это не все, у нас есть ряд других интересных проектов. Например, наша почта, вторая в Рунете, защищена от спама собственной разработкой — Спамообороной. Также есть крупнейший бесплатный хостинг Народ.ру или система электронных платежей Яндекс.Деньги, однако, ввиду правовых ограничений, он пока работает только в рублях и только на территории России. Для рекламодателей компания предоставляет сервис Яндекс.Директ, позволяющий самостоятельно создавать и
вести рекламную компанию в нашем поиске и в рекламной сети. У нас десятки тысяч клиентов, малый и средний бизнес. Кстати говоря, эта онлайновая деятельность приводит к вполне офлайновым последствиям, поскольку требования бухгалтерского оформления никто не отменял. У нас в штате даже есть две девушки (работающие на полную ставку), которые целый день занимаются только
тем, что ставят печати на бухгалтерских документах, а потом огромные коробки бумаг отправляют на почту для рассылки.

Елена, расскажите, пожалуйста, а что известно Яндексу о Беларуси?

По нашей статистике, Беларусь — одна из трех стран русскоязычной аудитории, по численности посетителей — третья. Еженедельно более 250 тысяч белорусов просматривают на Яндексе 6 миллионов страниц. Это примерно 2,3 процента от еженедельной аудитории Яндекса (более чем 11 миллионов человек).

Давайте поговорим о будущем. У бесплатной почты сегодня много проблем, и одна из них — спам, доля которого составляет примерно 80% от всей электронной корреспонденции. Не кажется ли вам, что этот сервис «умирает»?

Нет, конечно, сервис не умрет. Уже сейчас существуют достаточно эффективные методы борьбы со спамом. Взять хотя бы нашу «Спамоборону». Кроме того, здесь могли бы сыграть существенную роль и организационные решения.

Все мы слышали о таком решении, как электронные марки. Расскажите поподробнее.

Видимо, этот проект никогда так и не начнет работать. Потому как Интернет, по своей сути — схема децентрализованная. Система электронных марок подразумевает, что все договорятся и внедрят новое решение. Осуществить это просто нереально. Основная проблема в распространении спама — старые протоколы электронной почты, старые, незащищенные серверы. Ведь раньше при создании электронной почты никто не мог представить себе, что ее будут использовать во вред, поэтому старые почтовые релеи с удовольствием пересылают почту от одного адреса к другому. И невозможно уговорить всех владельцев релеев обновить программное обеспечение. Когда я говорю об организационных решениях, я имею в виду, что каждый владелец большого сегмента адресов, например, провайдер или администратор домашней сети, мог бы следить за безопасностью серверов в своем секторе, указывать владельцам серверов на бреши в защите, превращаясь в своеобразные санитарные силы. Известно, что спам массово идет из Южной Кореи: там на хороших каналах стоят плохо защищенные серверы, с которых отправляются миллиарды нежелательных писем по всему миру. В России серьезную проблему по защите компьютеров составляют домашние сети. А ведь некоторые из них насчитывают тысячи компьютеров. И думать о безопасности должны не столько конечные пользователи, сколько провайдеры — специалисты в области безопасности. Надо отметить, что основная проблема заключается не столько в спаме как в таковом, сколько в мошенничествах, совершающихся с его помощью, а также в том, что ему многие верят.

И все-таки, что ожидает в дальнейшем электронную почту?

Я думаю, что концепция существенно не изменится. Текстовая среда как была основной, так ею и останется. Хотя бы потому, что такой сервис прост и понятен неопытным пользователям. Моя мама, например, пишет друзьям одно письмо в неделю. И сервис ее вполне устраивает. А так как ее адрес знают только друзья, то и проблема спама заботит ее мало. Часть поклонников текстового общения уже сделала выбор в пользу instant messengers (системы мгновенного обмена сообщениями), но речь идет об определенном круге людей, перед которыми к тому же стоят определенные цели. Сегодня существуют проблемы и с мессенджерами. В отличие от почты, где все общаются по единому протоколу, ICQ, MSN и т.д. превращаются в «феодальные государства», используют закрытые протоколы и не допускают общения между собой. Думаю, что с развитием сети ситуация изменится, и победу одержат позволяющие интеграцию решения.

А как же аудио- и видеопочта?

Сегодня эти технологии развиваются достаточно быстро. Хотя я не вижу перспективы в обмене записанными голосовыми сообщениями. Мне кажется, что при необходимости проще позвонить по телефону. Но вполне представляю себе ситуацию, когда я что-то наговариваю в микрофон, правлю распознанный
текст и отправляю его. Теоретически возможно и обратное: мне прислали текст, а я хочу его не читать, а слушать. Mail.ru ввел голосовой сервис для чтения почты, однако пользоваться им удобно лишь в некоторых случаях.

Я также имел в виду и поисковые технологии...

Я думаю, что в ближайшее время мы будем осуществлять поиск по текстам, сопровождающим аудио- или видеофайлы, так как пока еще очень сложно распознавать речь внутри аудио. Конечно, в итоге мы все-таки придем и к непосредственному поиску внутри файлов. Однако это совсем другие объемы информации и другие вычислительные мощности.

Но ведь и ширина интернет-канала домашних пользователей увеличивается так же, как и возрастает интерес к мультимедийному контенту.

Да, естественно. В идеале ширина канала пользователя должна обгонять возможности контента по заполнению этого канала. Интернет становится все ближе к обычным людям. Во многом этому способствует переход от коммутируемого доступа к широкополосному (ADSL). Наш проект Яндекс.Тариф
поддерживает провайдеров, которые предлагают широкополосный доступ с неограниченным трафиком. Снимается очень важный психологический барьер — вход в Сеть: достаточно просто включить модем — и сразу оказываешься в Интернете. Не нужно специально дозваниваться, считать минуты. Опять же телефон
свободен: Интернет — отдельно, телефонные переговоры — отдельно.

Вслед за увеличением ширины канала разработчики большинства сайтов (например, в Lenta.ru) делают очень длинные первые страницы весом в несколько мегабайт.

Традиционно разработчики стремятся сделать дизайн сайта соответствующим интересам пользователей. Например, мы всегда стремились сделать первую страницу как можно легче, чтобы посетители обходились без прокрутки. Мы считаем, что сервисы должны быть быстрыми. И скажу вам по секрету, что посещаемость агрегаторов вроде news.yandex.ru на порядок выше, чем у любого новостного сайта.

В вашем тестовом задании для интернет-маркетологов есть вопрос о самых недооцененных, по мнению соискателей, сервисах Яндекса. В качестве ориентира вы предлагаете рассматривать посещаемость этих сайтов. Какого ответа вы ожидаете?

Вы понимаете, правильного ответа нет. Нам важны логика размышления, ход мыслей и даже талант. Разглядеть его, распознать уникальное понимание Интернета — вот задача нашей кадровой службы. А талантливых людей мы с удовольствием принимаем на работу. Мое мнение, что самым недооцененным
сервисом является поиск по блогам.

Говоря о посещаемости, следует сказать о такой серьезной проблеме, как сама система ведения подсчетов. Известно, что до сих пор машины не отличают cookies от человека.

Да, ситуация знакомая. Однако когда мы оцениваем посещаемость в 11 миллионов неважно чего (хоть «попугаев»), самым важным является то, чтобы и другие порталы, сайты «большой тройки» принимали за единицу изменения тех же «попугаев». Данные должны быть сравнимыми.

А вы не планируете проводить анализ поведения пользователей и использовать его результаты в работе?

Вы понимаете, на самом деле это очень серьезный вопрос. Мое мнение —
поведенческий анализ нужно использовать очень аккуратно. И только после того, как все другие инструменты уже были использованы. Ведь представление о поведенческом анализе выглядит следующим образом: например, человек интересуется автомобилем, соответственно, ему показывают рекламу
автомобилей. Завтра этот же пользователь зайдет на другой сайт, чтобы почитать газету, а мы ему опять показываем рекламу автомобилей. Правильно ли это? Может ли человек в момент чтения, скажем, общественно-политической статьи, думать о все том же автомобиле? В действительности поисковая реклама «ловит» пользователя именно в тот момент, когда интерес того выражен достаточно определенно, человек сам в строке запроса заявляет об этом. Всякая другая косвенная методика определения потенциальных интересов, на наш взгляд, — это всегда только догадка.

Но ведь даже Google использовала для анализа переписки пользователей бесплатную почту gmail с неограниченным объемом ящика.

Google пыталась показывать контекст, исходя из анализа текста письма, которое пользователь читал в данный момент. Однако это вызвало множественные протесты о «вмешательстве» в личную жизнь. Потом все успокоились, и реклама в почте продолжает существовать и по сей день. Однако история умалчивает о том, насколько она эффективна. Многие пользователи говорят, что она нерелевантна. Собственно, а что можно анализировать? Входящую почту — бессмысленно: там спам, рассылки и еще непонятно что. Значит, анализировать можно только исходящую почту. Как правило, человек использует ящик для
мультитематической переписки (и деловой, и дружеской одновременно). Как вы понимаете, в таких условиях вычленить «поведение» очень сложно. Очевидно, должен работать какой-то автомат, который будет анализировать группы и тенденции. Опять же возникает вопрос: а как грамотно их определить? Словом, пока методики «контекстного анализа» слишком далеки от практического применения. К тому же существуют примеры, свидетельствующие о том, что поведение человека иногда просто невозможно предугадать. Например, прошлой осенью интерес к обогревателям возрос только после падения температуры ниже 0С. До этого она колебалась от +15 до +5С, но уровень спроса оставался
прежним. А вот после того, как она упала с 0 до -1 С, всем сразу понадобились обогреватели. Разве здесь поможет какой-либо поведенческий анализ? Простая логика подсказывает: когда холодает, пользователям нужно показывать одни товары, а когда жарко — другие. И не нужно проводить никаких
сложных анализов.

Заканчивая нашу беседу, хочу поблагодарить вас за интересную беседу и задать последний вопрос: вам понравилось в Беларуси?

Да. В Минске чувствуешь себя как дома, в кругу друзей. На самом деле очень важно приехать и все увидеть собственными глазами, например, то, как развивается ваш белорусский Интернет. У нас с вами есть много точек соприкосновения. Надеюсь, наше сотрудничество будет плодотворно продолжаться.


В 19 номере газеты "Мой Компьютер" кроме этого интервью вы найдете беседы с главой Акавиты, Федором Короленко и Юрием Битно (ADSL.BY), а также обзор Nokia N93, тесты МФУ Xerox и многое другое. Рекомендованная цена издания – 960 рублей.

Материал публикуется по эксклюзивной договоренности с редакцией издания "Мой Компьютер".
Перепечатка без ссылки на "Мой Компьютер" и активной ссылки на IT.TUT.BY запрещена.



{banner_819}{banner_825}
-10%
-55%
-33%
-90%
-35%
-60%
-15%
-15%
-10%
-30%
0063371