Внедрение генеративного ИИ на предприятии :

Реальные проблемы, о которых никто не говорит

(и некоторые решения) — Часть 1 из 4

Дипам Мишра | www.tbicorp.com | linkedin.com/in/дипаммишра

Взрывной потенциал генеративного ИИ в бизнесе США

Фон

У большинства из нас теперь была возможность поиграть и удивиться возможностям chatGPT, Midjourney, DALL-E и т. д. Большинство бизнес-лидеров, с которыми я разговаривал, также стремятся использовать значительный потенциал автоматизации генеративного ИИ («GenAI »).

Несмотря на то, что существует много общих дискуссий и комментариев по поводу «проблем» генеративного ИИ, большинство из этих дискуссий носят в некоторой степени академический характер или касаются аспектов технологии, ориентированных на потребителя. Имхо, по большей части это результат явного удивления, с которым Gen-AI застал человечество. Как сказал Карл Сеган, любой такой большой технический скачок всегда выглядит как волшебство.

Тем не менее, действительно уместная дискуссия заключается в том, как предприятия могут начать использовать эту мощную кувалду ПРЯМО СЕЙЧАС, избегая при этом вредных побочных эффектов. И на каких вариантах использования компаниям следует сосредоточиться?

Каждую неделю я ловлю себя на том, что разговариваю с ведущими бизнес-лидерами, которые не знают, как, с чего и стоит ли начинать. Итак, сегодня я расскажу о некоторых опасениях и мифах, связанных с внедрением генеративного ИИ в корпоративные приложения.

Проблемы корпоративного внедрения

На мой взгляд, 4 реальные проблемы и проблемы заставляют предприятия приостанавливаться. Лидеры бизнеса, которые могут получить четкое представление об этом, могут сразу же начать использовать преимущества Gen-AI, реализуя значительные конкурентные преимущества. В этой серии из 4 частей я расскажу о следующем:

1. Генеративный ИИ дает фактически неверные или нереферентные ответы (например, галлюцинации).

2. «Мы не контролируем конфиденциальность и безопасность данных»

3. «Генеративный ИИ слишком дорог для рутинных задач»

4. «Системам генеративного ИИ нельзя доверять или они могут навредить пользователям (черный ящик)»

Проблема № 1: неправильные ответы

«chatGPT дает почти 80% фактически неправильных ответов. Мое бизнес-кейс требует стопроцентной точности», — сказал технический директор крупного банка.

Правда или ложь?

Хотя это реальный опыт для многих пользователей chatGPT, но такие обобщенные утверждения предполагают ограниченное представление и поверхностное понимание того, как работают базовые модели Gen-AI. Как мы увидим, это не лучшая практика использования Gen-AI на предприятиях.

Два лица Gen-AI

Проще говоря, большинство людей смешивают две важные, но разные инновации, предлагаемые базовыми моделями генеративного ИИ, и, следовательно, смешивают оценку этих двух различных аспектов:

(1) Понимание языка и генерация языка — пожалуй, бесспорно, что сегодняшние базовые модели (FM) имеют «умное человеческое» понимание языка и коммуникации. Эти FM могут легко «понимать» сложные запросы, что указывает на значительные достижения в области понимания естественного языка (NLU). Точно так же эти FM также могут генерировать языковые ответы, которые являются очень естественными и привлекательными, в отличие от кратких или ограниченных ответов прошлого, подобных ботам. Сегодняшние FM не только включают в себя продвинутые языковые навыки и грамматику, но также могут сочетать свои ответы с юмором, эмоциями и стилем. Я уверен, что вы видели, как chatGPT изливает содержательные стихи на предложенные темы, и понимаете, что я имею в виду. В целом, эти FM обеспечивают гораздо лучший опыт общения, чем прежние чат-боты. Языковое и коммуникативное знание FM является одной из их основных сильных сторон.

Коммуникации и возможности генерации генеративного ИИ, такого как Джаспер

(2) Поиск и извлечение данных — способность FM извлекать информацию на основе понимания языка является совершенно другим аспектом и может быть отделена от языковых навыков. Этот «навык» требует, чтобы LLM (или FM) не только понимал суть запроса, но и мог сопоставить соответствующий текст из своего учебного корпуса. Хотя это может показаться простым, это очень сложный процесс, который сродни всей технологии, используемой в поисковых системах Интернета, таких как Google.

Процессы поиска и извлечения обычно используют предварительную обработку и индексирование информационного корпуса.

Чтобы хорошо выполнять поиск и поиск, LLM должен знать, какое «совпадение» является лучшим для данного запроса, и, следовательно, это непростая задача. Поиск хорошего соответствия может потребовать более глубокого понимания таких аспектов, как

· Домен поиска — например, математический запрос или запрос по определенному отраслевому термину, такому как финансовый арбитраж, может потребовать тонкого понимания темы. Ответ не может быть простым упражнением по поиску и извлечению.

· Распаковка намерения запроса — иногда сам запрос может быть запутанным или многоуровневым, и LLM могут интерпретировать их по-разному. Например, если кто-то просит систему прогнозирования предсказать, когда «погода улучшится», намерение может представлять разные вещи в зависимости от местоположения, типа личных предпочтений и т. д.

· Отсутствие конкретных или прямых ответов — иногда ответы просто недоступны или, возможно, требуют многоэтапных запросов. Это может быть за пределами возможностей регулярно обучаемого LLM.

· Расстановка приоритетов и/или объединение нескольких ответов — такие поиски, как обычный поиск в Google, часто выдают ранжированный список результатов. Системы Gen-AI часто просят предоставить обобщенный или единый ответ, что может быть более сложным.

В целом, этот второй набор возможностей FM связан с контекстным поиском и ранжированием результатов и полностью отличается от синтеза языка.

Итак, как думать о точности GenAI

Пользователи должны оценить возможности моделей генеративного ИИ на основе вышеуказанных возможностей. Сверхспособности генеративного ИИ можно и нужно использовать для понимания языка и человеческого общения. Именно здесь современные инструменты, такие как IVR, чат-боты и т. д., предлагают очень разочаровывающий и неэффективный опыт.

В качестве особого примера корпоративного поиска разработчики могут разделить задачу поиска и извлечения информации с помощью традиционных методов и/или использовать базовые модели среднего размера с настраиваемым обучением. Это позволит предприятиям лучше проектировать общие системы, обеспечивающие лучший контроль и точность. В этом примере огражденное использование GenAI (для связи) сведет к минимуму опасения по поводу неправильных ответов.

Это не единственный шаблон проектирования для уменьшения количества неправильных ответов. Также могут помочь улучшенные подсказки, точно настроенные базовые модели, политики фильтрации после поиска и другие методы.

Ключевые вынос

По мере того, как наше понимание FM будет улучшаться, мы найдем лучшие способы контролировать их работу. Однако даже сегодня существуют проверенные и надежные шаблоны проектирования для использования FM в серьезных случаях корпоративного использования. Например, использование различных систем на основе FM для поиска и извлечения данных и передачи данных (или «генерации») может уменьшить общие проблемы.

Далее: "Если я буду использовать chatGPT для бизнеса, я не смогу контролировать конфиденциальность и безопасность своих данных"