Нейросети: Как они открывают доступ к знаниям?

С сентября 2024 года количество запросов в Яндекс Поиск с Нейро увеличилось на 49%. Многие пользователи успели «распробовать» удобство нейросетей для поиска информации – число пользователей этой технологии выросло на 62%. Одно из главных его преимуществ – при поиске информации через Яндекс Поиск с Нейро можно сэкономить до 30 минут в день. Теперь пользователи могут оперативно найти информацию на казахском или русском языках, причём с указанием источников данных. Об этом и о других возможностях искусственного интеллекта рассказали специалисты компании Yandex Qazaqstan на воркшопе для студентов в университете AlmaU в Алматы. Воркшоп – часть образовательной серии практических мастер-классов по ИИ для студентов, которые Yandex Qazaqstan начал проводить с октября 2024 года. Об этом сообщает корреспондент центра деловой информации Kapital.kz.

Директор по развитию « Яндекс Поиска» в Казахстане Улан Кайрбеков начал своё выступление с данных. Ежедневно в Яндекс Поиске казахстанцы задают свыше 8 млн запросов. И эта цифра постоянно растёт, — подчеркнул он. «Меня радует, что 32% ответов нейросетей в поиске посвящена образованию», — отметил эксперт.

Нейросети: Как они открывают доступ к знаниям?  3797055 — Kapital.kz

По его словам, за 25 лет поисковые системы трансформировались, как и их алгоритмы. Появились такие опции, как «умная камера», голосовой помощник, быстрые ответы на вопросы и многие другие. «Когда же наступил 2022 год, наблюдался бум использования LLM (большой языковой модели). Эта технология работает на основе определенных алгоритмов, которые изучили миллионы текстов, книг, статей, сайтов и других данных. На основе этой информации LLM прогнозирует, какое словосочетание или слово последует после первой фразы или слова. Причём, исходя из контекста запроса», — подчеркивает он.

Следующий этап развития технологий – на рынке появились генеративные чат-боты. Зачастую такие чат-боты отвечают на вопросы даже более углубленно, чем реальные люди. «Интересно, что такие модели ИИ стали проходить тест Тюринга, который определяет, может ли машина мыслить. Например, человеку предоставляют возможность пообщаться в чате с искусственным интеллектом. И если он не может отличить, взаимодействует ли он с «живым» собеседником или всё-таки с AI, то модель можно назвать умной», — отмечает Улан Кайрбеков.

Как нейросети меняют процесс поиска

Чтобы получать ответы на более сложные вопросы в Yandex Qazaqstan решили объединить поисковую систему и генеративные модели. Например, если вбить запрос: «Какая столица Канады?», то можно обойтись и быстрым ответом. Если же вопрос будет звучать так: «Каковы особенности экономики Шелкового пути?», то тут потребуется уже развернутый ответ. Ведь поисковику нужно будет определить и подобрать релевантные источники и собрать данные в один комплексный ответ со ссылками на источники. В этом случае как раз и поможет Нейро в Яндекс Поиске.

Ещё одно преимущество нейросетей — быстрый анализ большого массива данных.

Например, вы хотите узнать: «Какой монарх был дольше всех у власти?» или у вас есть аналогичный вопрос, который потребует сравнение огромного объёма данных. До появления Яндекс Поиска с Нейро пришлось бы пройти несколько этапов: найти примеры на разных сайтах, проверить релевантность данных на сайте, сравнить данные между собой. А теперь достаточно только сделать запрос, и если потребуется углубиться в тему, то перейти по представленным источникам информации.

Также нейро поисковик умеет считывать хронологию событий. Если ввести запрос: «Как мы отдыхаем весной?», то с помощью «нейро» поисковик представит все праздники именно на текущий год, а не на 2024 год или 2023-ий. Причём, по хронологии: сначала мартовские, после апрельские и майские.

«Буквально на днях мы запустили важное обновление – Яндекс Поиск с Нейро теперь научился отвечать на уточняющие вопросы и работает в режиме диалога – пояснил Улан Кайрбеков.

В Яндекс Поиск подробно рассказали, какие сложности возникли при обучении модели казахскому языку. Один из главных вызовов, — дефицит контента в сети на казахском языке. А именно, статей, выдержек из книг или научных работ.

Нейросети: Как они открывают доступ к знаниям?  3797065 — Kapital.kz

«Например, хочется ввести вопрос на казахском: «Какие виды водорослей есть в Средиземном море?». Но мы столкнулись с тем, что не находим такую информацию на казахском языке, потому что ранее никто не написал на этом языке научную статью на эту тему. Но этот контент можно найти на английском языке и после на основе этих статей дать ответ на казахском языке на этот запрос. Тем не менее мы уделили много ресурсов всей команды, привлекались двуязычные тренеры, поэтому "Нейро" умеет отвечать на казахском языке нативно, даже если на входе получает документы на английском», — поделилась ведущий менеджер «Яндекс Поиска» Салтанат Болатбекова.

Вторая проблема – понимание контекста в омонимах. «Казахский язык очень богат на омонимы. Например, есть такие слова омонимы «саз», «жүз» и «бет». Они могут иметь различное значение в зависимости от контекста предложения.

«Слово «саз» может переводиться как болотная местность, музыка, мелодия и даже сырость. То есть его значение меняется в зависимости от контекста. Поэтому второе слово в запросе, которое вводит пользователь после омонима, очень важно при обучении модели. Запуск такой опции был неким вызовом для нас», — рассказала она.

Метафоры, названия песен и пословицы также могут сложно поддаваться переводу на казахский язык. «У нас было множество необычных запросов. Один из них: «Аягөз Қайда Барасың». Наш «нейро» сначала подумал на наших первых тестах, что это запрос про район в Абайской области. И соответственно пытался так и ответить на запрос, кстати, в Абайской области же ещё есть и река Аягоз. А на самом деле пользователь хотел найти песню с таким названием. Таким образом, модели нужно было понять, что именно ищет человек: район, песню, а может это стихотворение или пословица. Модель не должна была переводить напрямую запрос, а должна была понимать запрос в контексте. Эту задачу мы также реализовали в поиске», - резюмировала Салтанат Болатбекова.

Нейросети: Как они открывают доступ к знаниям?  3797070 — Kapital.kz

На практическом мастер-классе в университете AlmaU студенты могли задать любое вопросы специалистам Yandex Qazaqstan: как работают алгоритмы поиска. Также Ольга Курданова, руководитель группы стратегических партнёрств Yandex Ads, провела интерактивный мастер-класс, где участники погрузились «в глубины» цифрового маркетинга. Студентам, которые задали самые интересные вопросы, и победителям игры подарили Станцию Лайт 2 с виртуальным ассистентом Алисой и другие подарки.

Нейросети: Как они открывают доступ к знаниям?  3797072 — Kapital.kz