uz
Feedback
эйай ньюз

эйай ньюз

Kanalga Telegram’da o‘tish

Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением. Ex-Staff Research Scientist в Meta Generative AI. Сейчас CEO&Founder AI стартапа в Швейцарии. Aвтор: @asanakoy PR: @ssnowysnow

Ko'proq ko'rsatish
2025 yil raqamlardasnowflakes fon
card fon
84 445
Obunachilar
+124 soatlar
+417 kunlar
+58930 kunlar
Postlar arxiv
Нейродайджест за неделю (#91) LLM - Claude Code получил веб-версию — По аналогии с Codex, агенту выдают виртуалку для выполнения задач и коммитов на GitHub. Пока сыровато, но уже доступно подписчикам Pro и Max. - ChatGPT Atlas — AI-браузер от OpenAI. Взяли Chromium и встроили туда все свои AI-фичи: чат с вкладками, локальный Agent Mode и умный поиск по истории. Пока только на Mac. Генеративные модели - Synplant 2 — Genopatch пересинтезирует звуковой сэмпл в полноценный патч, который можно докручивать. Прочее - Лейофы в Meta AI и что делать, чтобы тебя не уволили — Комментарий по поводу увольнений в Meta Superintelligence Lab и смещении фокуса в Big Tech с долгосрочного ресёрча на проекты, которые быстро шипятся и приносят измеримый бизнес-импакт. - Anthropic получит более миллиона TPU — Компания, похоже, покупает, а не арендует у Google гигаваттный кластер из более чем миллиона TPU, который запустят в 2026 году. Это первый случай такого масштабного использования TPU за пределами Google. - Включение из Сан-Франциско — я на конференции Generative Media Conference от fal.ai. > Читать дайджест #90 #дайджест @ai_newz
Hammasini ko'rsatish...
star reaction 1 46🔥 22👍 12❤‍🔥 4😁 2🦄 1
Алекс Ванг увольняет 600 человек из Meta Superintelligence Lab - пример непревзойденного лидерства от молодого человека. У Меты уже входит в привычку делать по 2 раунда увольнений каждый год, за мое время там я пережил минимум 3 волны лейофов. Оптимальность решений лидершипа в последнее время под большим вопросом. Многие толковые ресерчеры, предвидя это, не соглашались даже на огромные офферы ($10M+) лично от Марка - знаю таких людей. Некоторые другие, кто все же перешёл, ливнули через 1-2 месяца. А ризонинг модели от Меты как не было так и нет. Визуальные модели, кажется тоже стагнируют и не было видных обновлений после моего ухода (не то чтобы все только на мне держалось, но все же)), вот вместо этого заключили партнерство с Black Forest Labs. Такими темпами очередь дойдет и уволить старичка ЛеКуна, заменив его 25-летним отчисленцем из универа. Сейчас в Мете, как и в других Фаангах, в приоритете команды, которые шипят каждый месяц, а не делают долгосрочный речерч. Их если и чикают, то очень ограниченно. А вот для классических ресерчеров, которые работают над долгосрочными проектами (FAIR-style), сейчас не самый лучший климат в индустрии. Чтобы я посоветовал, тем кто сейчас работает в BigTech, чтобы избежать увольнения? Стройте стартап свой публичной бренд внутри компании, работайте только над проектами, которые имеют максимальную видимость, фокусируйтесь на бизнес импакте. Ваши модели, которые вы тренируете должны приность +xx% user engagement, +yy% revenue, -zz% latency and costs. В постах о ваших проектах всегда должно читаться "This guy has shipped fast and delivered measurable business impact". Как бы грустно это не звучало, индустрии сейчас нужны люди, которые умеют строить решения, приносящие деньги сейчас, а не те, кто будет потеть полгода-год над одной публикацией, которая в итоге в прод так и не попадет. #imho @ai_newz
Hammasini ko'rsatish...
star reaction 2 190🫡 106👍 30😁 21😱 15🔥 11💔 9❤‍🔥 4💯 2
Я прилетел в Сан-Франциско. И уже на конференции Generative Media Conference от fal.ai. Подходите поздороваться, если вы тоже тут! #personal @ai_newz
Hammasini ko'rsatish...
star reaction 4 151🔥 48👍 33😁 5❤‍🔥 4🦄 3🤯 1😱 1💔 1
Anthropic получат более миллиона TPU Для тех кто не в курсе — TPU это кастомные чипы для тренировки и инференса от Google. Они чуть более специализированные (например там есть специальные ядра для рекомендательных систем) и заметно лучше по нетворкингу по сравнению с GPU от Nvidia, но проигрывают по флопсам на отдельный чип. Более подробно про последнее поколение TPU я писал тут. Кластер будет потреблять около гигаватта и запустят его уже в 2026 году. Это будет первый случай настолько масштабного использования TPU за пределами Google. При этом похоже, что Anthropic именно купят эти TPU, а не возьмут в аренду. Broadcom, компания которая производит TPU для Google, недавно заявила о 10 миллиардах дополнительной выручки от нового клиента. Аналитики и до анонса говорили что этот клиент – это Anthropic, а теперь поводов так считать стало ещё больше. TPU для Anthropic это далеко не новая тема, компания активно их использует и для инференса и для тренировки. Это не удивительно — Google инвестировал в Anthropic больше 3 миллиардов долларов. Ну и это ещё видно по вакансиям на TPU и Jax, которые у Anthropic регулярно появляются последние несколько лет. @ai_newz
Hammasini ko'rsatish...
84👍 45🔥 30🫡 8🦄 4
00:58
Video unavailableShow in Telegram
Synplant 2 Продолжаю писать про нейронки для музыкантов. На этот раз — довольно специфичный инструмент. Synplant — это очень необычный синтезатор и любимый инструмент, пожалуй, одного из самых интересных электронных музыкантов, Flume, который известен своим ломаным ритмом и потусторонним саунд-дизайном. Обычно в синтезаторе ты крутишь разные ручки и получаешь звук. Здесь же в основе всё полностью рандомно. Сначала "сеешь семя", затем, двигаясь по ветвям, смотришь на рандомные генерации звуков. Понравилось направление — снова сеешь семя и уже смотришь на его "детей". Процесс уже очень похож на генетические алгоритмы в машинном обучении, так что нейросети сюда вписались абсолютно логично. Во вторую версию синта можно закинуть любой сэмпл, а Genopatch попробует его пересинтезировать, создав из него полноценный патч. И делает это она очень хорошо, а главное — локально на CPU. Почему это топ? Раньше, если ты хотел взять сэмпл, ты должен был использовать его как есть. А если хотел играть разные ноты, приходилось его репитчить (изменять высоту), что знатно шакалит исходник. Теперь же появилась возможность его пересинтезировать и использовать уже синтезированный звук. Это даёт более чистый звук и возможность его докрутить уже стандарными ручками, получив свою уникальную версию. Короче, снова больше свободы для творчества и качества звука. Стоит плагин ощутимо — $199, но зато без подписок. (Хотя все мы знаем, откуда битмейкеры берут свои синты). Музыканты в чате, как вам такая штука? Пробовали Synplant? @ai_newz
Hammasini ko'rsatish...
4.09 MB
100👍 36❤‍🔥 14🔥 12 2😱 2
01:38
Video unavailableShow in Telegram
ChatGPT Atlas — ИИ браузер от OpenAI OpenAI сделали свой браузер, прорыва не случилось — просто взяли Chromium и интегрировали туда все свои AI фичи. Добавили возможность чатится со своими вкладками и помощник для написания текста в любом текстовом поле. Agent Mode теперь работает не только где-то там в облаке, но и в локальных вкладках со всеми доступами юзера (интересно как это работает внутри и насколько сильно будет жрать батарею). Поиск по истории браузера, где можно описать страницу и браузер сможет её найти — это первое использование памяти ChatGPT, посмотрев на которое мне не захотелось сразу его выключить. По дефолту на данных из браузера тренировка проводится не будет, но можно opt-in. Браузер уже доступен всем пользователям на маках, Agent Mode дают только платным подписчикам. На другие платформы обещают завезти позже. https://chatgpt.com/atlas @ai_newz
Hammasini ko'rsatish...
chatgptatlas.mp49.40 MB
😁 81👍 51🔥 24 17🦄 9💔 5🤩 2
01:01
Video unavailableShow in Telegram
Claude Code получил веб версию Работает это примерно так же как и у веб версии Codex — агенту выдают виртуалку, где он может выполнять заданные ему таски и потом коммитить результаты на гитхаб. Доступ к интернету можно ограничивать через кастомные вайтлисты, но для экстремалов сделали возможность убрать ограничения на домены (только не жалуйтесь потом на промпт инъекции). По сравнению с Codex он стартует быстрее, но интерфейс менее отполирован. Пока что это превью, причём достаточно сырое. У меня, к примеру, из коробки не заработал Cargo (менеджер пакетов для Rust), потому что в дефолтный вайтлист добавили не все необходимые ему домены. Кроме этого возможность контролировать облачный Claude Code добавили в iOS приложение. Хочется такой же функционал для контроля локального инстанса Claude Code/Codex. Превью облачного Claude Code уже доступно всем Pro и Max подписчикам. https://claude.ai/code @ai_newz
Hammasini ko'rsatish...
claudecodeweb.mp46.81 MB
🔥 91 25👍 24😱 4🦄 2💯 1
Нейродайджест за неделю (#91) Генеративные модели - VEO 3.1 — Google обновили свой видеогенератор. Главное — теперь можно редактировать сгенерированные видео прямо во Flow. Также добавили генерацию по референсу и другие фичи для продакшена. - RIP Social Media — Sora 2 уже автоматизируют для создания UGC-рекламы. Это может убить рынок вертикальных блогеров (но не сейчас) и заспамить ленты ещё сильнее. - Объём данных Sora 2 — Модель знает лютую дичь из постсоветского ТВ вроде Малышевой, но всё ещё не может сгенерить человека, садящегося в машину. > Читать дайджест #90 #дайджест @ai_newz
Hammasini ko'rsatish...
star reaction 1 23🤯 17👍 12❤‍🔥 3🙏 2
Кстати, редактирование все-таки крутое у них вышло. https://t.me/cgevent/13792 @ai_newz
Hammasini ko'rsatish...
star reaction 3🔥 106 19👍 13🤯 9😍 6
01:25
Video unavailableShow in Telegram
VEO 3.1 🔥🔥🔥🔥🔥 Видеогенератор от Google обновился до версии 3.1. Всё в целом стало получше, особенно отмечают улучшения в img2video. Но почему-то мало кто говорит о том, что во Flow теперь можно РЕДАКТИРОВАТЬ ВИДЕО (впрочем Moviegen, который я тренировал в Мете это тоже умеет). Правда, Veo редактирует только сгенерированные видео, но это как минимум намекает, что возможно скоро можно будет и обычные (лицо Runway видели?). Кстати, топ фича для нейронного продакшена, даже в текущем формате. Ну и по мелочи: добавили Ингредиенты (аналог Elements), генерацию по start/end фреймам, продление видео и удобный prompt enhancer с пресетами. А вот 1080p во Flow по-прежнему отсутствует. Sora 2, конечно, хайпит, но она будто бы для мемов сделана. Veo 3.1 — не слишком большой скачок вперёд, но теперь это как минимум достойный конкурент. Мне кажется, в AI-продакшене она всё ещё будет предпочтительнее. @ai_newz
Hammasini ko'rsatish...
28.89 MB
star reaction 1 114🔥 48👍 30
00:23
Video unavailableShow in Telegram
RIP Social Media (нет) Уже какое-то время UGC (User-Generated Content) находится в топе инструментов для коммерческой рекламы. Даже крупные бренды идут за рилсами к нишевым блогерам (таким как я). Это работает, потому что люди доверяют людям, а не креативным агентствам. Но нет, сегодня про Sora 2. Как уже говорил, новая Sora может привести к смерти социальных сетей и UGC-контента или как минимум знатно потрепать рынок. Не люблю цитировать Твиттер, но посмотрите, что собрали с Sora 2 на n8n. На вход картинка продукта, по желанию промпт. На выходе готовый ролик в 1080p, без вотермарок (а как же безопасность? Видимо, бизнеса это не касается), с монтажом, звуком и всеми делами. Главная фишка в том, что такие видео можно лить тоннами с разных аккаунтов. Наличие аудитории у блогера вообще не важно, потому что рекомендательные системы со времён Тиктока пушат просто хороший контент (даже рекламный), если он достаточно залипательный. Не сложно додуматься, что с такими автоматизациями нейронный спам польётся рекой в ленты ещё пуще прежнего, и никуда от него не денешься. Вертикальным блогерам остаётся только посочувствовать. Ну либо делать такой контент, который AI пока ещё не под силу (например, как садиться в машину 😄). Хороший повод ещё раз удалить тикток, и мечтаю, чтобы шортсы в ютубе можно было отключить. Источник @ai_newz
Hammasini ko'rsatish...
6.81 MB
star reaction 1😱 127 117😁 41👍 27🔥 21💯 19🤯 9🙏 3🦄 3❤‍🔥 1
Жесть какой объем видео было скормлено в Сору 2 во время тренировки. Знает даже всякую лютую дичь из нашего постсоветского телевизора, типа Малышевой. Но человека, садящегося в автомобиль, сгенерить не может – не достаточно данных все-таки. Все ещё ждем решений суда об использовании всего этого контента и внешности существующих людей. Я если что за свободное использование фото видео из интернета (выложил в ютуб - распрощался с правами), но уж слишком Альтман борзо себя ведёт. @ai_newz
Hammasini ko'rsatish...
star reaction 2😍 74🤯 52😁 49 19🔥 17👍 3🦄 2💯 1
Нейродайджест за неделю (#90) Юбилейный LLM - OpenAI DevDay — мини-приложения в ChatGPT. Плюс AgentKit (аналог n8n) и ChatKit для интерфейса. В API добавили GPT-5 Pro с конским ценником ($15/$120) и мини-версии других моделей. - Nvidia инвестирует в xAI — вложит $2 миллиарда, но не напрямую, а через SPV, которая закупит GPU для кластера Colossus 2 и будет сдавать их в аренду. - Сколько генерят нейронки —Gemini обрабатывает 1.3 квадриллиона токенов в месяц, а API OpenAI — более 250 триллионов. Генеративные модели - Sora 2 в API — Sora 2 и Pro теперь доступны в API по адекватной цене: 10 центов/сек за обычную версию. Pro-версия дороже, но с 1080p и длиной до 15 секунд. > Читать дайджест #89 #дайджест @ai_newz
Hammasini ko'rsatish...
👍 29 15🔥 8 4🤩 2❤‍🔥 1
Вчера Google анонсировали что Gemini теперь обрабатывает 1.3 квадриллиона токенов в месяц, с конца июля нагрузка выросла на 30%. Это цифра для всего использования Gemini — и для продуктов Google и для внешних разработчиков. Это какое-то безумное количество токенов — для сравнения, это эквивалентно обработке нескольких миллиардов книг каждый месяц. Но тем не менее цифра ещё и неимоверно маленькая — ведь в перерасчёте, на каждого человека на планете, в среднем выходит лишь 160 тысяч токенов в месяц (сравните это со своим использованием). Google не единственная компания с такими масштабами — OpenAI на Devday заявили что их API обрабатывает 6 миллиардов токенов в минуту, то есть больше 250 триллионов токенов в месяц. Напрямую сравнивать это с цифрами гугла разумеется нельзя — у OpenAI гигантское количество токенов потребляется 800 миллионами пользователей ChatGPT, что не учитывается в использовании API. Но понятно что уровень нагрузки у компаний сопоставимый, хоть глобально это всё ещё крайне мало. @ai_newz
Hammasini ko'rsatish...
🔥 115 42🤯 27👍 17❤‍🔥 2😍 1
MWS AI выпустила первый бенчмарк для тестирования мультимодальных моделей на русскоязычных документах — MWS Vision Bench. До этого момента разработчики могли полагаться только на OCRBench или MMMU, которые работают исключительно с английским и китайским языками, что делало невозможной адекватную оценку моделей для российского рынка. Это решает реальную боль компаний: теперь можно объективно сравнить, насколько хорошо разные VLM-модели справляются с типовыми задачами. Что проверяет бенчмарк: • Распознавание текста на сканах договоров и официальных документов • Извлечение структурированных данных из таблиц и форм • Понимание рукописных заметок и аннотаций • Работа со схемами, чертежами и диаграммами • Ответы на сложные вопросы по содержимому документов Бенчмарк включает 800 реальных изображений и 2580 заданий, полностью обезличенных и максимально приближенных к реальным рабочим сценариям. Команда MWS AI сделала бенчмарк полностью открытым: код выложен на GitHub, валидационный датасет доступен на HuggingFace. Любой желающий может скачать, запустить тесты на своих моделях и сравнить результаты с лидерами — сейчас это Gemini 2.5 Pro, Claude Sonnet 4.5 и ChatGPT-4.1 mini. Архитектура позволяет добавлять новые типы задач и адаптировать бенчмарк под специфические кейсы. То есть он может служить фундаментом для развития экосистемы русскоязычных мультимодальных моделей, которые наконец-то можно сравнивать по единым, прозрачным метрикам. @ai_newz
Hammasini ko'rsatish...
👍 72😁 32🔥 23 5🤯 3
Nvidia будет частью нового раунда финансирования xAI Особенность раунда в том, что акций xAI инвесторы не получают. Всё идёт через SPV (Special Purpose Vehicle), специально созданную компанию, которая приобретёт GPU для Colossus 2 и будет сдавать их в аренду xAI. В чём-то это похоже на схему OpenAI со Stargate. Доля Nvidia составит 2 миллиарда, а в целом размер раунда ожидается в 20 миллиардов — 7.5 будут акциями SPV, остальное в долг. @ai_newz
Hammasini ko'rsatish...
😁 93 24👍 18🦄 11🔥 4🫡 4😱 3😍 1
Что показали на OpenAI DevDay Главный анонс — мини-приложения в ChatGPT. На старте их семь, анонсировали ещё 11. Чатгпт будет периодически сам подсказывать подходящее приложение по контексту диалога. Фича открыта почти всем авторизованным пользователям вне ЕС, каталог приложений и приём заявок на публикацию приложений от разработчиков обещают до конца года. Приложения собираются на веб-технологиях поверх MCP. Примеры с исходниками уже есть на GitHub. Обещают кучу способов монетизации своих приложений, OpenAI всё ещё плотно хотят свой апстор, несмотря на провал GPTs. AgentKit и ChatKit. AgentKit — набор для сборки и продакшен-запуска агентов с визуальным конструктором, коннекторами и встроенными инструментами оценки. ChatKit — готовый встраиваемый чат-интерфейс, чтобы быстро дать пользователю доступ к вашему агенту прямо в продукте. Описывать флоу агента теперь можно в новом визуальном интерфейсе Agent Builder, теперь создание агентов доступнее. В API тоже насыпали моделей. Sora 2 и Sora 2 Pro теперь доступны в API. Pro версия отличается длиной генерации в 15 секунд вместо 10 и поддержкой 1080p. Цена 10 центов за секунду для обычной модели, что дешевле даже Veo 3 Fast. Pro версия стоит 30 центов за секунду 720p видео и 50 центов за 1080p. На удивление адекватная цена для такого уровня качества. А вот GPT-5 Pro обвинить в разумном прайсинге нельзя. $15/$120 за миллион токенов для ризонера это крайне много, с такой ценой модель продолжит оставаться очень нишевой. Кроме этого вышли мини варианты gpt-realtime и gpt-imagе, чтобы удешевлять продакшен-кейсы. Как у них с качеством всё ещё неясно, но цена неплохая. @ai_newz
Hammasini ko'rsatish...
star reaction 1🔥 70👍 38 35🙏 4🦄 2