Почему облачные ИИ опасны для бизнеса с чувствительными данными

Каждый день тысячи сотрудников российских, казахстанских и белорусских компаний загружают в ChatGPT клиентские данные, договоры, финансовые отчёты и внутреннюю переписку. Большинство из них — и их руководители — не задумываются о том, что с этими данными происходит дальше.

Эта статья не про теории заговора. Это разбор конкретных рисков, которые возникают при использовании облачных ИИ в бизнесе с чувствительными данными. И о том, как с ними работать.

Что происходит с данными, когда вы используете облачный ИИ

Когда сотрудник вводит запрос в ChatGPT, Gemini, Claude.ai или любой другой облачный сервис — данные уходят на серверы компании-провайдера. Это базовый факт, который не скрывается в условиях использования.

Дальше возможны несколько сценариев — в зависимости от тарифа и политики конкретного сервиса:

Использование для обучения моделей. По умолчанию большинство бесплатных и дешёвых тарифов позволяют провайдеру использовать ваши запросы для улучшения моделей. Это прямо прописано в условиях. Вы кормите чужую модель своими данными.

Хранение на серверах провайдера. История запросов хранится на серверах компании — OpenAI, Google, Anthropic. Серверы находятся в США и других странах. Формально это означает, что ваши данные подпадают под юрисдикцию этих стран.

Доступ сотрудников провайдера. В ряде инцидентов подтверждалось, что сотрудники компаний-провайдеров имели доступ к пользовательским чатам для разметки данных и контроля качества.

Риск утечки при взломе. История знает случаи, когда данные пользователей ИИ-сервисов оказывались скомпрометированы. В марте 2023 года OpenAI подтвердила утечку, при которой часть пользователей видела чужие истории чатов.

Платные корпоративные тарифы обычно дают более строгие гарантии. Но они стоят значительно дороже, требуют отдельного договора и всё равно означают, что данные обрабатываются за пределами вашей инфраструктуры.

Какие данные особенно рискованно передавать в облако

Не все данные одинаково чувствительны. Вот категории, с которыми особенно важно быть осторожным.

Персональные данные клиентов

ФИО, телефоны, адреса, паспортные данные, история покупок — всё это персональные данные по 152-ФЗ в России и аналогичным законам в других странах СНГ. Их обработка регулируется законом, а передача за рубеж — отдельно.

Если ваш сотрудник вставляет в ChatGPT список клиентов с контактами для «анализа» — это потенциальное нарушение законодательства о персональных данных.

Финансовые данные

Бухгалтерская отчётность, условия сделок, кредитные договоры, данные о задолженностях, зарплатные ведомости. Это не только коммерческая тайна — в ряде случаев это информация с особым режимом защиты.

Коммерческая тайна

Технологические карты производства, рецептуры, патентоспособные разработки, условия договоров с поставщиками и клиентами, стратегические планы. Однажды уйдя на сервер провайдера, эта информация де-факто выходит из-под вашего контроля.

Корпоративная переписка и внутренние документы

Протоколы совещаний, кадровые решения, внутренние конфликты, переписка с юристами. Всё это может содержать информацию, которую вы точно не хотели бы видеть в открытом доступе или в руках конкурентов.

Регуляторные риски для бизнеса СНГ

Использование облачных ИИ с данными клиентов — это не просто вопрос безопасности. Во многих случаях это вопрос соответствия законодательству.

152-ФЗ «О персональных данных» (Россия)

Закон требует, чтобы персональные данные российских граждан хранились и обрабатывались на серверах, расположенных на территории Российской Федерации. Трансграничная передача данных разрешена только при соблюдении ряда условий.

Когда вы передаёте персональные данные в ChatGPT — они обрабатываются на серверах OpenAI в США. Это трансграничная передача без надлежащего оформления. Роскомнадзор фиксирует такие нарушения и выносит предписания.

Банковское регулирование (ЦБ РФ)

Для финансовых организаций — банков, МФО, страховых — действуют дополнительные требования к информационной безопасности. Обработка клиентских данных на зарубежных серверах противоречит этим требованиям.

Законодательство Казахстана и Беларуси

Аналогичные нормы о локализации данных действуют в Казахстане (Закон о персональных данных и их защите) и Беларуси. Логика та же: данные граждан страны должны обрабатываться в её юрисдикции.

Отраслевые стандарты

Медицинские данные, адвокатская тайна, нотариальная тайна, аудиторская тайна — все эти категории имеют особые режимы защиты. Использование облачных ИИ с такими данными создаёт серьёзные профессиональные и правовые риски.

Реальные инциденты, о которых стоит знать

Риски — не абстракция. Вот несколько задокументированных случаев.

Samsung, 2023 год. Сотрудники компании трижды за короткое время загрузили в ChatGPT конфиденциальные данные: исходный код программного обеспечения, внутренние записи совещаний и результаты испытаний оборудования. После этого инцидента Samsung запретил сотрудникам использовать внешние ИИ-инструменты на корпоративных устройствах.

Утечка в OpenAI, март 2023 года. Из-за ошибки в Redis-библиотеке часть пользователей могла видеть заголовки чужих чатов, информацию о платёжных картах и имена других пользователей. OpenAI подтвердила инцидент.

Amazon, 2023 год. Сотрудники Amazon загружали внутренние данные компании в ChatGPT, после чего руководство направило предупреждение о рисках утечки конфиденциальной информации.

Всё это — крупные компании с развитыми службами безопасности. В малом и среднем бизнесе контроль за тем, что сотрудники делают с данными, обычно значительно слабее.

Миф: «Я плачу за корпоративный тариф — всё безопасно»

Корпоративные тарифы ChatGPT Enterprise, Gemini для бизнеса и аналоги дают дополнительные гарантии. Данные не используются для обучения моделей (по заявлению провайдеров), есть шифрование, журналирование и другие меры.

Но несколько вещей остаются верными при любом тарифе:

Данные всё равно уходят на серверы провайдера. Вы не контролируете инфраструктуру, где они обрабатываются.

Провайдер находится в другой юрисдикции. Американский закон о надзоре (CLOUD Act) обязывает американские компании предоставлять данные американским властям по запросу — даже если данные хранятся за пределами США.

Зависимость от провайдера. Цены могут вырасти. Сервис может стать недоступен (санкции, технические проблемы). Условия могут измениться. Вы не контролируете ничего из этого.

Стоимость. Корпоративные тарифы облачных ИИ стоят в разы дороже, чем развёртывание открытых моделей локально — особенно при масштабировании.

Как работать с ИИ без передачи данных наружу

Решение существует и оно не требует многомиллионных инвестиций. Это развёртывание открытых языковых моделей локально — в вашей инфраструктуре.

Что такое открытые модели

За последние два года появились открытые языковые модели, которые по качеству вплотную приближаются к GPT-4, а в ряде задач превосходят его. Llama 3 от Meta, Mistral от французской команды, Qwen от Alibaba, Gemma от Google — всё это модели с открытым исходным кодом, которые можно развернуть локально.

Ключевое слово — локально. Модель запускается на сервере внутри вашей инфраструктуры. Данные не покидают ваш периметр. Никаких внешних API-запросов, никаких передач.

Что нужно для развёртывания

Для большинства задач малого и среднего бизнеса достаточно:

  • VDS-сервер от 4 ядер ЦП и 16 ГБ оперативной памяти (около 3 000–7 000 рублей в месяц)
  • Linux с Docker
  • Для сложных задач с большими объёмами — GPU-сервер

Это значительно дешевле корпоративных тарифов облачных сервисов, особенно при масштабировании.

Закрытый контур: что это значит на практике

Закрытый контур — это принцип работы, при котором вся обработка данных происходит внутри вашей инфраструктуры:

  • ИИ-модель развёрнута на вашем сервере
  • Все запросы обрабатываются локально
  • Данные не передаются в интернет
  • Вы контролируете все логи обработки
  • Система работает даже без подключения к интернету

Такой подход снимает регуляторные риски, устраняет зависимость от провайдера и позволяет работать с любыми чувствительными данными.

Примеры задач, которые решаются в закрытом контуре

Обработка документов. Извлечение данных из договоров, накладных, медицинских карт, юридических документов — локально, без передачи наружу.

ИИ-ассистент для сотрудников. Внутренняя база знаний, ответы на вопросы по регламентам, помощь в составлении документов — всё работает на вашем сервере.

Анализ клиентских обращений. Классификация, суммаризация, извлечение задач из переписки — с реальными данными клиентов, без риска утечки.

Контроль качества. Проверка документов, звонков, текстов на соответствие стандартам — с использованием конфиденциальных нормативов.

Как перейти от облачных инструментов к закрытому контуру

Переход не требует единовременной замены всего. Разумная стратегия — начать с одного процесса.

Шаг 1. Определите, какие задачи ваши сотрудники решают с помощью ChatGPT или аналогов прямо сейчас. Проведите неформальный опрос.

Шаг 2. Классифицируйте: какие из этих задач работают с чувствительными данными? Именно эти задачи нужно переводить на локальный контур в первую очередь.

Шаг 3. Выберите одну задачу с понятным результатом — и запустите пилот с локальной моделью. Сравните качество с облачным решением.

Шаг 4. После успешного пилота последовательно переводите остальные задачи.

Для задач, где данные не чувствительны (публичная информация, маркетинговые тексты, общие вопросы) — облачные инструменты вполне приемлемы. Не нужно переходить на локальный контур ради всего подряд.

Частые возражения — и ответы на них

«Открытые модели хуже, чем GPT-4»

Это было правдой два года назад. Сегодня Llama 3.1 405B, Mistral Large и Qwen 2.5 72B демонстрируют результаты, сопоставимые с GPT-4, на большинстве практических задач. Для специализированных бизнес-задач — обработки документов конкретного типа, ответов по конкретной базе знаний — дообученные локальные модели зачастую превосходят универсальные облачные.

«Слишком дорого и сложно разворачивать»

Базовая конфигурация для малого бизнеса — VDS за 3 000–5 000 рублей в месяц. Корпоративный тариф ChatGPT для команды — от 20 долларов в месяц на человека. При команде из 10 человек это 200 долларов, то есть около 18 000–20 000 рублей. Разница очевидна.

Сложность развёртывания — реальная, но это задача подрядчика, не ваша. Один раз настроить — и система работает.

«У нас нет IT-специалистов»

Для использования системы после развёртывания IT-специалист не нужен. Сотрудники работают с ИИ-ассистентом через обычный интерфейс — как с мессенджером. Обслуживание берёт на себя подрядчик или системный администратор по инструкции.

«Нам не угрожает утечка, мы небольшая компания»

Утечки данных происходят не только через целенаправленные атаки. Сотрудник уволился и взял с собой доступ к истории чатов. Конкурент получил информацию через третье лицо. Провайдер изменил политику использования данных. Регулятор провёл проверку. Для малого бизнеса последствия таких событий могут быть катастрофическими именно потому, что нет ресурсов на их устранение.

Чек-лист: как проверить, есть ли у вас риски прямо сейчас

Пройдите по этим пунктам:

  • Ваши сотрудники используют ChatGPT, Gemini или другие облачные ИИ в работе?
  • В запросах встречаются имена клиентов, телефоны, email?
  • В запросах используются внутренние документы: договоры, счета, технические задания?
  • Вы работаете в регулируемой отрасли: финансы, медицина, юриспруденция?
  • Вы обрабатываете персональные данные граждан РФ, РК или РБ?
  • У вас нет внутренней политики использования облачных ИИ?

Если отметили хотя бы три пункта — риски реальны и стоит разобраться с ними до того, как случится инцидент.

Итого

Облачные ИИ — мощные инструменты, и для многих задач они вполне подходят. Проблема не в технологии, а в том, с какими данными её используют.

Для задач, где обрабатываются персональные данные, финансовая информация, коммерческая тайна или данные из регулируемых отраслей — передача в облако создаёт реальные риски: регуляторные, репутационные и коммерческие.

Альтернатива — локальное развёртывание открытых моделей в закрытом контуре. Это не сложнее и не дороже облачных решений, но даёт полный контроль над данными и независимость от внешних провайдеров.

Правило простое: если данные нельзя опубликовать в открытом доступе — их не стоит передавать в облачный ИИ.

Если хотите разобраться, как внедрить ИИ-автоматизацию без передачи данных наружу — мы проводим бесплатный аудит. Анализируем ваши процессы и показываем, как это работает на вашей инфраструктуре. Без обязательств.

Не знаете, с чего начать?

Проведём бесплатный аудит за 5 дней — найдём лучшую точку автоматизации для вашего бизнеса. Без обязательств.

Получить бесплатный аудит →