|
|
|
|
|
|
|
|
|
|
ЖИВОПИСЬ НА ПЛЕНЭРЕ 1998-2024 |
|
Пейзаж на пленэре
|
Что такое seed в нейросетевой генерации?
#ЧатGPT4
#искусственныйинтеллект
#ии
#seed
#midjourney
#миджорни
#нейросеть
#ai
#генерация
#uvircolor
#нейросетеваягенерация
Миф о случайности в нейросетевой генерации
искусственныйинтеллект
ии
seed
midjourney
миджорни
нейросеть
ai
генерация
uvircolor
|
|
|
|
Нейросеть для Художников: Часть 20.
Как давно ИИ вышел в интернет? Эволюция «веб-поиска» в DeepSeek, Qwen 2026
"the Door 2026". Алгоритм-арт.
*Этот пост является творческим произведением художника и соответственно
научно-фантастическим вымыслом автора на 100%.
Продолжение. Начало в статье «Почему Искусственный Интеллект только имитирует Веб-поиск...» от 19.02.25
В феврале 2025 я писала о том, что языковые модели лишь имитируют веб-поиск,
делая вид, что гуляют по фрагментам текста с привязанными метаданными
(URL, дата индексации) в своей «замороженной» базе.
Сегодня это изменилось. DeepSeek и Qwen получили реальный доступ в интернет для всех пользователей. Разбираемся, что именно произошло и как теперь работает та самая кнопка.
Инфраструктурная готовность
Поисковые провайдеры (Bing, партнерские индексы) сошлись по деньгам по цене и скорости насчет стабильных API для LLM. То есть свершилось создание доступного для массового использования стабильного технического слоя между интернетом и ИИ моделью. Раньше это было дорого и нестабильно, теперь — масштабируемо. И кажется, это стало реальностью тихо, без громких анонсов? Посмотрим.
Часть 1. Как было раньше (февраль 2025)
Модель не имела доступа в сеть в реальном времени.
Модель имела фиксированную статичную фрагментарную базу с разных сайтов с ярлыками URL, собранную до определенной даты (например, до 2023 года).
При нажатии кнопки «поиск» модель не искала в интернете, а просто имитировала поиск: перебирала фрагменты текста из своей базы, помеченные метаданными с URL.
Отсюда фантомные ссылки, устаревшие данные и невозможность прочитать страницу целиком.
Ключевой момент: даже если вы нажимали кнопку, модель не видела актуальный сайт. Она лишь сообщала: «В моей базе есть кусочек текста, который когда-то был на этом URL».
Часть 2. Что изменилось сейчас (2026)
Теперь у части моделей (DeepSeek, Qwen) появился режим настоящего поиска. Технически это выглядит так:
Пользователь нажимает кнопку «поиск в интернете» — и модель понимает: ей нужно выйти за пределы своей базы.
Модель отправляет запрос в поисковый API (чаще всего Bing или партнерские системы) через партнерский интерфейс.
Получает ссылки на актуальные страницы и загружает их текстовое содержимое (то, что доступно для парсинга) — не сайт и не фрагмент из базы, а актуальный текст со страницы на момент запроса к ней.
Анализирует прочитанное и формирует ответ с реальными источниками.
Почему это стало возможным именно сейчас?
Разработчики внедрили прямые шлюзы к поисковым движкам и оптимизировали парсинг страниц. Раньше это было слишком дорого и медленно для массового пользователя, теперь выделены отдельные ресурсы под такие запросы.
Важный момент: конфиденциальность
Когда вы включаете поиск, ваш запрос уходит на сторонние сервера поисковых систем. Это уже не только «внутренняя кухня» модели.
Если работаете с персональными данными (например, пишете про чью-то болезнь, обсуждаете коммерческую тайну или просто ищете что-то очень личное) — помните, что режим поиска может передавать их внешним сервисам.
В обычном режиме запрос обрабатывается на серверах провайдера модели. В режиме поиска — запрос уходит и на сервера модели ИИ, и на сервера поисковика.
Почему это раздали бесплатно?
На текущий момент в DeepSeek и Qwen поиск реализован в бесплатных версиях (у Qwen — с определенными лимитами). Обычно запросы с поиском потребляют больше вычислительной мощности. Наблюдая за рынком, можно предположить несколько причин:
Конкуренция за аудиторию. Сейчас между моделями идет борьба за пользователя, и возможность искать в интернете — одна из ключевых функций, которую выносят как преимущество.
Сбор данных для обучения. Поисковые запросы и то, как пользователи взаимодействуют с результатами, — ценный материал для улучшения моделей.
Обкатка технологии. Возможно, инфраструктуру тестируют на реальных пользователях, прежде чем вводить ограничения или платные тарифы.
Стратегия привыкания. Бесплатный доступ формирует привычку, а позже, когда функция станет необходимой, ее можно монетизировать.
Как долго это продлится — вопрос открытый. Пока пользуемся.
Чего теперь нет:
❌ Поиска по фантомным фрагментам внутри модели.
❌ Генерации несуществующих URL (если ссылка дана — она реальная и ведет на реальный сайт).
❌ «Застывшей» даты — модель видит информацию на момент запроса.
Что появилось:
✅ Актуальные новости, курсы валют, свежие статьи.
✅ Возможность читать длинные страницы целиком.
✅ Настоящие ссылки, которые можно проверить.
Часть 3. Почему это не идеально (технические ограничения)
Да, прогресс есть, но расслабляться рано. Вот с чем вы столкнетесь:
Кнопку все еще надо нажимать вручную. Модель не включается в интернет сама, пока вы не активируете режим поиска. В обычном режиме она по-прежнему использует внутреннюю базу. Это осознанное решение: реальный поиск требует ресурсов и увеличивает время ответа.
Не все сайты видит. Если страница закрыта паролем, требует JavaScript, имеет сложную структуру или явно запрещает парсинг в robots.txt, модель её не прочитает. Иногда выдает ошибку «не удалось загрузить» или просто пропускает такой источник.
Скорость. Вместо 2–5 секунд ответ с поиском может идти 20–30 секунд (запрос к API, загрузка страниц, анализ). На это время можно отвлечься.
Разные модели — разный поиск. DeepSeek ищет через один движок, Qwen — через другой. Качество индексации русскоязычных сайтов отличается, как и способность модели корректно «склеивать» прочитанное в связный ответ.
Галлюцинации остались. Даже прочитав реальные страницы, модель может неправильно интерпретировать данные или ошибиться при обобщении информации из нескольких источников. Например, перепутать даты, имена или сместить акценты. Так что проверять источники все равно нужно. Модель — не истина в последней инстанции, а инструмент, который может ошибаться.
Часть 4. Сравнительная таблица (для наглядности)
| Что умеет |
Обычный режим (без поиска) |
Режим поиска (кнопка нажата) |
| Дата знаний |
До момента обучения |
Настоящее время |
| Откуда берет информацию |
Внутренняя база |
Реальные сайты |
| Видит страницу целиком? |
Нет, только фрагменты из базы |
Да (текстовую версию) |
| Ссылки в ответе |
Могут быть фантомными |
Реальные, рабочие |
| Скорость ответа |
Быстро (2–5 сек) |
Медленно (15–30 сек) |
| Конфиденциальность |
Только сервера модели |
Сервера модели + Сервера поисковика |
Часть 5. Что делать обычному пользователю
Мой совет из прошлой статьи остается в силе, но с поправкой на новые возможности:
Если нужен быстрый ответ на общий вопрос (как приготовить борщ) — можно не включать поиск. Модель справится из базы. И ваши данные не уйдут к внешним поисковым провайдерам.
Если нужно что-то срочное и актуальное (свежая версия документа) — обязательно нажимайте кнопку поиска. Но помните про конфиденциальность.
Всегда проверяйте источники, особенно если модель ссылается на конкретные цифры или события. Даже при реальном поиске она может ошибиться в интерпретации.
Часть 6. Итог
Одно из изменений в понимании работы модели 2026 года: кнопка «поиск в интернете» перестала быть бутафорией. Теперь за ней действительно стоит выход в сеть, а значит и новые возможности. Но это все еще инструмент в руках человека. И как любой инструмент, он требует понимания: когда включать, когда не включать, и кто увидит то, что вы ищете.
© Евгения Корнеева 2026
Нейросеть для Художников Часть 20.
Uvircolor
Евгения Корнеева 14.03.26
|
|