Вкалывают роботы, а не человек
Теперь так можно! О том, как спихнуть рутину на искусственный интеллект «Вестнику» рассказал руководитель группы исследований и разработки технологий машинного обучения АО «Лаборатория Касперского» Владислав Тушканов. Эксперт убедил консервативного редактора «Вестника» в том, что нейросеть – это не про легализацию лени.
– Сделаю небольшую отсылку к Терминатору и всем пугалкам про порабощение человечества искусственным интеллектом. Это враки или реальная угроза?
– Сто процентов нет, нужно понимать, что эти классные вещи основаны на простом алгоритме, который называется языковой моделью. Ее суть в том, что она предсказывает слово по предыдущим словам. Когда мы говорим: «Красноярск стоит на реке», алгоритм должен предсказать «Енисей». Никакой более продвинутой функции нет. Искусственный интеллект не умеет думать. у него нет мыслительного процесса и интенций поработить человечество. Это просто механическое предсказание одного слова за другим. Другой вопрос, что язык – сложная штука, и чтобы предсказать «Енисей», нужно знать, как устроена грамматика, синтаксис, морфология, иметь знания о мире. Когда этот текст генерируется, создаётся ощущения, будто алгоритм думает, но на самом деле это вероятностная штука, которая из распределения достает самое вероятное слово. Далеко нам до порабощения.
– Условные знания языковой модели – это вся информация, которая есть в сети?
– Это все документы, которые использовались для обучения – триллионы триллионов слов. Обычно обучением больших нейросетей занимаются компании, имеющие доступ к данным всего интернета, например, Google, Microsoft, Yandex. У них есть поисковые машины, которые проиндексировали весь интернет и у них есть возможность заниматься такими алгоритмами.
– Если рассматривать перспективу на ближайшие лет десять, специалистов какой отрасли может заменить нейросеть?
– Мы можем говорить о выполнении каких-то действий нейросетью, но не о замене специалиста целиком. Идея в том, чтобы автоматизировать рутинные действия. Я иногда занимаюсь разработкой, и в этом случае я придумываю, что нужно написать. Например, беру какой-нибудь код, мне интересно, можно ли его сделать лучше, что-то ускорить, поизящнее написать. Для этого загружаю код в нейросеть, спрашиваю и получаю ответ. Она не заменяет меня, но дает возможность отвлечься от рутинных вещей и получить как бы второе мнение по тому, что я делаю. То же с обычным текстом. Например, для меня английский язык не является родным. Я пишу на английском не на сто процентов уверенно. Поэтому загружаю абзац в чат-бот и даю команду отредактировать, улучшить текст. Такая совместная работа даёт лучший результат за более короткое время.
– Разговоры о том, что нейросеть заменит бухгалтера – ерунда?
– Когда появился Excel, который, сильно упрощает работу с числовыми данными, бухгалтеры исчезли? Кто-то в любом случае должен знать, что именно загрузить, какие данные, в каком виде, и потом поставить свою подпись под этим – взять ответственность за результат. Возможно, бухгалтеров, копирайтеров, переводчиков нужно будет меньше. Но в целом, говорить о том, что эти профессии вымрут – не приходится.
– Если внедрить нейросеть в рутинную работу, например, новостной редакции, может встать вопрос о авторском праве?
– В американских судах есть некоторое количество исков, где авторы текстов или художники подают в суд с вопросом: если эта сеть обучалась на результатах моего интеллектуального труда, можно ли считать, что то, что создаёт сеть – это тоже результат моего интеллектуального труда, и в таком случае я имею право требовать, чтобы мои данные оттуда убрали, или я имею право на роялти.
Вопрос дискуссионный, на него сложно ответить. Он возникает во многих сферах, и в картинках, и в текстах, и в программном коде. Есть эксперименты, которые показывали, что нейросети могут почти дословно цитировать статьи, программный код, который они видели при обучении. Это вопрос больше юридический, чем практический, и правоприменение пока в будущем лежит.
Алгоритмов, которые детектируют сгенерированную нейросетями курсовую или диплом пока нет. Но если идея придумана человеком, эксперименты, измерения или анализ проведены человеком, то какая разница?
– Есть предпосылки того, что использование нейросети на производстве будет регламентироваться законодательством?
– Есть инициатива по маркированию контента, который создан с помощью нейросетей, это делается на уровне платформ, например, YouTube. Это может происходить на уровне государства, например, в Китае и в России такие инициативы тоже обсуждаются. Считаю, что это правильно, особенно если изображение претендует на фотореалистичность, я бы хотел знать, действительно это фотография или картинка сгенерирована и то, что я вижу на кадре никогда не происходило.
– Предлагаю поговорить о самых распространенных видах кибератак с использованием искусственного интеллекта? Какие щиты можно использовать?
– Самая известная и используемая технология – это дипфейки, когда с помощью нейросетей злоумышленники генерируют изображение, голос, видео, чтобы вовлекать потенциальных жертв в мошеннические схемы: перевести деньги, перейти по ссылке, оставить личные данные, платёжные данные и так далее.
Чтобы обезопасить себя, мы традиционно советуем не оставлять свои данные на незнакомых сайтах. Не важно, пришла вам подозрительная ссылка пришла в спаме, или была под видео, где какой-то знаменитый человек поздравляет вас с выигрышем в лотерее – не оставляйте там свои данные. Поэтому рекомендации стандартные: кибергигиена и использование защитных систем помогают уберечься от большинства угроз. Несмотря на то, что мошенники используют дипфейки, чтобы сделать свои схемы более эффективными.
Тембр голоса довольно легко скопировать, мошенники этим пользуются. Но голос – это гораздо больше. Это еще и манера, словечки, которые мы используем, особенности построения фраз. Как правило, мошенники не записывают длинные сообщения, имитируют короткую голосовуху, а потом общаются текстами. Поэтому, чем длиннее кусочек материала, тем сложнее его подделать.
– Теперь из фантазийного. Как думаете, когда наступит время, когда, например, я смогу создать своего клона? Загрузить в отдельный аккаунт материалы, чтобы обучить нейросеть, и на выходе получить статьи, написанные моим стилем?
– Уже сейчас можно. На самом деле, для этого не нужна нейросеть. Давно есть такие алгоритмы, как «Цепи Маркова», которые можно обучить на каком-то корпусе текстов и генерировать похожий текст. Это стандартная студенческая задачка для лингвистов – написать «Цепи Маркова», обучить на пьесах Шекспира, чтобы сеть генерировала что-то похожее на пьесы Шекспира. Если данных достаточно, действительно можно с помощью специальных методов обучения заставить алгоритм писать в том или ином стиле.
Цель людей, которые работают с текстами не в том, чтобы написать текст, а в том, чтобы этот текст выполнил функцию, ради которой создаётся. Например, корреспондент информирует аудиторию о каком-то событии. Если часть этого написана нейросетью, то какая разница? Если редактор пользуется сервисом «Главред», чтобы проверить текст на ошибки, а не просматривает все только глазами, становится его труд менее ценным, или главное – получить на выходе причёсанный текст без ошибок?
– Мне кажется, что искусственный интеллект ведет нас к легализации лени и снижению общего уровня интеллекта. Что думаете по этому поводу?
– Мне кажется, наоборот. Представьте, что перед вами сложная задача. Задачу нужно разбить какое-то количество маленьких шагов, чтобы прийти от нуля к искомой цели. Вот это самое сложное, а потом исполнить каждый конкретный шаг, если это прочий алгоритм, то что в этом плохого?
Мне кажется, что люди не стали от этого глупее. Задачи стали сложнее, времени на их исполнение стало меньше, нам нужно все время повышать эффективность, чтобы успевать отрабатывать эти задачи.
– Если говорить о науке, мы можем использовать нейросеть, допустим, для изучения мертвых языков: эсперанто, латынь, майя?
– Интересный вопрос. Есть большое неравенство в сфере обработки естественного языка, которая учит машины понимать человеческий язык. Во-первых, обработка естественного языка очень англоцентрична, поэтому многие задачи хорошо решаются на английском языке и гораздо хуже на всех других. Большим европейским языкам, например, русскому повезло. У нас один из самых больших сегментов интернета, одна из самых развитых Википедий, много данных, много текстов – нам хорошо, единственное, у нас язык сложный. Для малых региональных языков России создано очень мало ресурсов, многие из этих языков постепенно вымирают, речь о северных языках Карелии, языках народов Дагестана. Поскольку я по образованию лингвист, знаю, что есть инициативные люди, которые собирают корпуса таких языков и пытаются обучить эти модельки. Одна из вещей, на которые способны эти модели – сделать слепок того, что известно о языке, и попытаться его как-то сохранить.
– Как быстро в ближайшие годы будет эволюционировать и развиваться искусственный интеллект?
– Если бы меня три года назад спросили, будет ли у нас то, что у нас сейчас есть, я бы никогда этого не сказал, поэтому будущее предсказывать не стремлюсь. Я уверен, существующим технологиям будут находить новое полезное применение, чтобы они действительно экономили нам ресурсы, чтобы они действительно делали нас более продуктивными. Много внимания будет уделяться повышению надежности этих решений, чтобы они не генерировали ложные факты, чтобы они не отклонялись от тем, чтобы их нельзя было взломать, переписать их инструкции, заставить говорить что-то нехорошее и так далее.
– Если подытожить, простыми словами искусственный интеллект – это что такое?
– Это сфера исследования, которой много десятков лет, ее суть в том, что машины берут на себя интеллектуальные задачи. Если чуть более узко, то машинное обучение – это когда мы прописываем алгоритмы по шагам: если так – сделай так, если так – сделай вот так. Машинное обучение дает нам историю: какие решения человек принимал на основе этих данных. Мы не описываем каждую программу, а просто загружаем их в алгоритмы и с помощью математических методов учим отделять вредоносные программы от невредоносных. В более узком смысле искусственный интеллект – про то, как заставить машину правильно принимать решения, которые нам будут полезны.
КСТАТИ:
ИИ будет помогать югорским чиновникам.
Персонального нейропомощника разработают для каждого высокопоставленного чиновника Югры. Такой уже есть у губернатора. По запросу цифровой ассистент по имени Миша помогает Наталье Комаровой собрать информацию об исполнении бюджета, составляет сводку происшествий в регионе за сутки и даже раздает поручения подчиненным.
– Таких цифровых помощников мы хотим создать для каждого руководителя: начали с губернатора, сейчас начали делать заместителям губернатора, постепенно дойдем до отраслевых министров. Каждый такой цифровой помощник индивидуален и адаптируется под конкретного человека, под его задачи, стиль разговора, – приводит ТАСС слова замгубернатора Югры Павла Ципорина.
В перспективе цифровых ассистентов обучат составлять протоколы совещаний и даже контролировать выполнение поручений.
Подписывайтесь на наш telegram-канал: там только самые важные новости из жизни Сургутского района, Сургута и ХМАО.
Алсу Хайретдинова
Фото предоставлено АО «Лаборатория Касперского» и из архива редакции
Материал опубликован в газете «Вестник» №21 от 31 мая 2024 года
чтобы не пропустить новые публикации