Data Science
الذهاب إلى القناة على Telegram
DS По всем вопросам- @haarrp @ai_machinelearning_big_data - machine learning @pythonl - Python @itchannels_telegram - 🔥 best it channels @ArtificialIntelligencedl - AI @pythonlbooks-📚 @programming_books_it -📚 Реестр РКН: https://clck.ru/3Fk3zS
إظهار المزيد2025 عام في الأرقام

41 332
المشتركون
-624 ساعات
-117 أيام
+21830 أيام
أرشيف المشاركات
Photo unavailableShow in Telegram
Stabilizing Reinforcement Learning with LLMs: Formulation and Practices
📚 Read
@datascienceiot
00:10
Video unavailableShow in Telegram
Представьте, что вы проснулись в недалёком будущем. Как бигтех работает с контентом?
Мультимодальные и рекомендательные системы нового поколения — это то, что уже сейчас определяет мир, в котором мы скоро будем жить.
Сотрудники VK рассказали, над чем работает их группа R&D и другие команды. Заходите по ссылке — смотрите ролики и знакомьтесь с нашей внутренней кухней.
1203(1).mp47.88 MB
From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence
📚 Book
@datascienceiot
Photo unavailableShow in Telegram
Test-time scaling of diffusions with flow maps
⚡️ Project
@datascienceiot
Ozon Profit расширил возможности по сбору и разметке данных для ML
Краудсорсинговая платформа добавила функцию выездных заданий по всей России. Это существенно расширяет инструментарий data-специалистов для работы с данными.
💡Что это значит на практике?
🟠Компании смогут нанимать исполнителей для сбора данных в поле: фотофиксация витрин, проверка цен, аудит сервиса.
🟠Исполнители выполняют разметку текстов, изображений, видео, анализ обращений клиентов и определение тональности для обучения ML-моделей.
🟠Более 40 000 активных исполнителей в сети. Доступны API-интеграции для автоматизации загрузки данных и запуска заданий.
Платформа позиционирует себя как решение для технологических проектов, маркетплейсов и стартапов, которым требуется масштабируемая обработка данных.
Photo unavailableShow in Telegram
This new research from Meta introduces Matrix, a peer-to-peer framework where multiple AI agents collaboratively generate synthetic training data through decentralized interactions.
📚 Read
@datascienceiot
Photo unavailableShow in Telegram
На AI Journey презентовали крупнейший open-source проект в Европе: Сбер открыл доступ к своим флагманским моделям - GigaChat Ultra-Preview и Lightning, а также новое поколение открытых моделей GigaAM-v3 для распознавания речи, все модели генерации изображений и видео новой линейки Kandinsky 5.0 — Video Pro, Video Lite и Image Lite.
GigaChat Ultra-Preview, новая MoE-модель, 702 миллиарда параметров, собранная под русский язык и натренированная полностью с нуля. Читайте подробный пост от команды.
Впервые в России обучена MoE-модель такого масштаба полностью с нуля — без зависимости от зарубежных весов. Обучение с нуля, да и ещё на таком масштабе, — это вызов, который приняли немногие команды в мире.
Флагманская модель Kandinsky Video Pro сравнялась с Veo 3 по визуальному качеству и обогнала Wan 2.2-A14B. Читайте подробный пост от команды.
Код и веса всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.
Photo unavailableShow in Telegram
Помните, как это было? Кофе, зачетка и возможность просто учиться без спринтов и задач
29 ноября в 16:00 будет Back to Uni — встреча-ностальгия в кампусе Центрального университета для ИТ-сообщества.
Что вас ждет:
— Пары от преподавателей ЦУ — применять знания не обязательно, будет просто интересно.
— Возможность узнать, как и зачем ИТ-специалисту преподавать в вузе, даже если нет опыта или страшно начать.
— Студенческие клубы, разговоры по душам в коридорах и та самая атмосфера, где можно просто вдохновляться.
Пары будут вести руководитель отдела прикладного ML в AI-центре Т-Банка Андрей Мельников, руководитель аналитики международного Яндекс Поиска Роман Васильев, к.м.н., руководитель направления исследований «Мышление и AI» в лаборатории нейронаук и поведения человека Сбера Яна Венерина и другие эксперты.
Это бесплатно. Приходите с однокурсниками — ностальгировать вместе.
Регистрируйтесь по ссылке тут!
Photo unavailableShow in Telegram
OpenMMReasoner: Pushing the Frontiers for Multimodal Reasoning with an Open and General Recipe"
📚 Read
@datascienceiot
Вышел подробный разбор на примере VK про то, как крупные рекламные платформы выстраивают ML-архитектуру:
🔹 Product ML: модели бюджетирования, прогнозирования конверсий, выбора креативов
🔹 Anti-fraud ML: бертовые энкодеры и LLM для обнаружения аномалий и сложного фрода
🔹 Discovery-платформа: фактически полный ML-пайплайн, объединяющий данные и модели для рекомендаций, поиска и рекламы.
Читать
Repost from Machinelearning
04:17
Video unavailableShow in Telegram
✔️ Модель P1 взяла золото на Международной олимпиаде по физике.
Shanghai AI Lab натренировал семейство моделей P1 для решения сложнейших физических задач. Флагманская модель P1-235B-A22B добилась исторического результата, став первой открытой моделью, которая решила задачи Международной олимпиады по физике 2025 года на уровень золотой медали.
P1 сравнялась на физическом бенче HiPhO по количеству медалей с Gemini-2.5-Pro и обошла GPT-5. Основой успеха стала мультиагентная система PhysicsMinions, которая итеративно проверяет и улучшает решения, анализируя их логику и физическую состоятельность.
Весь проект P1, включая сами модели и бенчмарки, опубликован в открытом доступе.
prime-rl.github.io
✔️ Google готовит тысячекратное увеличение ИИ-мощностей.
Техногигант планирует в 1000 раз нарастить свои вычислительные мощности для ИИ в течение следующих 4-5 лет. По словам топ-менеджеров, Google уже вынуждена удваивать серверные емкости для ИИ каждые полгода, чтобы справляться с растущей нагрузкой.
Руководство Google считает, что риск недоинвестирования в инфраструктуру сейчас выше, чем риск перерасхода средств. План расширения опирается на три элемента: более тесную интеграцию аппаратного и программного обеспечения, повышение эффективности моделей и использование кастомных чипов.
cnbc.com
✔️ В NotebookLM добавили возможность создавать презентации и инфографику.
Сервис расширили функцией генерации слайдов на основе загруженных источников. Инструмент подойдет для быстрого структурирования информации и создания черновиков презентаций или визуально улучшения уже существующих материалов.
Слайды доступны для скачивания в формате PDF, экспорт в Google Slides и PowerPoint уже находится в разработке. За работу новой функции отвечает Nano Bana Pro.
Лимиты на использование зависят от типа аккаунта пользователя.
NotebookLM в сети Х
✔️ Reality Labs Марка Цукерберга анонсировала text-to-world систему.
WorldGen — система генерации полностью интерактивных 3D-мирой на основе простых текстовых запросов. Технология использует процедурную логику и диффузионные модели для создания детализированных и стилистически выдержанных локаций размером до 50x50 метров.
Итоговые сцены WorldGen, согласно демо-роликам, не просто статичны, а готовы к навигации и взаимодействию. Созданные миры совместимы с игровыми движками Unity и Unreal и не требуют дополнительных конвертаций или сложной настройки рендеринга.
Проект находится на стадии исследования и пока недоступен для широкого использования.
roadtovr.com
✔️ Ubisoft создает ИИ-NPC для игр.
Игровая студия анонсировала экспериментальный проект Teammates, который меняет взаимодействие с неигровыми персонажами. Технология на базе генеративного ИИ позволяет NPC понимать естественную речь и действовать как участники процесса, а не просто скриптовые боты.
В рамках прототипа, созданного на основе шутера от первого лица, игроку помогают два ИИ-напарника и голосовой ассистент Джаспар. Они способны реагировать на голосовые команды: подсвечивать цели, предоставлять информацию о сюжете, изменять игровые настройки или ставить игру на паузу. Система анализирует контекст и действия игрока, обеспечивая динамическую реакцию персонажей в реальном времени.
Ubisoft говорит, что проект уже прошел закрытое тестирование. По мнению CEO компании, ИИ станет для индустрии революцией, сравнимой с переходом игр от 2D к 3D.
news.ubisoft.com
@ai_machinelearning_big_data
#news #ai #ml
2411.mp421.63 MB
Data-driven — звучит красиво, но чем больше это слово повторяют, тем меньше становится понятно, что оно значит на самом деле.
С одной стороны, все твердят, что решения должны основываться на данных. С другой — никто толком не объясняет, как это выглядит в реальной жизни. Где проходит грань между «мы сделали дашборд» и «мы реально принимаем решения иначе»? Почему одним компаниям удается стать data-driven, а другие буксуют годами? И вообще — это необходимость или просто очередное модное выражение, которое со временем забудут?
На вебинаре «Data-Driven: хайп или реальная необходимость» от karpovꓸcourses Дмитрий Казаков разберет эту тему без пафоса и абстрактных фраз. Вам расскажут, что стоит за data-driven подходом, какие реальные проблемы он решает и почему у компаний возникают сложности с внедрением. Это не про «как должно быть», а про «как бывает на самом деле» — со всеми шероховатостями, сопротивлением и типичными ошибками.
Спикер — Дмитрий Казаков, директор по аналитике Kolesa Group. 10+ лет опыта в data, BI и ML. Создает эксперименты, строит data-культуру и делится опытом с аналитиками как ментор и преподаватель.
Вебинар бесплатный и пройдет 27 ноября в 18:00 по МСК, присоединяйтесь по ссылке: https://clc.to/erid_2W5zFGNvuyA
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFGNvuyA
Photo unavailableShow in Telegram
Introduction to Compilers and Language Design
📚 Book
@datascienceiot
Photo unavailableShow in Telegram
The state of AI in 2025: Agents, innovation, and transformation
📚 Read
@datascienceiot
Data-driven — звучит красиво, но чем больше это слово повторяют, тем меньше становится понятно, что оно значит на самом деле.
С одной стороны, все твердят, что решения должны основываться на данных. С другой — никто толком не объясняет, как это выглядит в реальной жизни. Где проходит грань между «мы сделали дашборд» и «мы реально принимаем решения иначе»? Почему одним компаниям удается стать data-driven, а другие буксуют годами? И вообще — это необходимость или просто очередное модное выражение, которое со временем забудут?
На вебинаре «Data-Driven: хайп или реальная необходимость» от karpovꓸcourses Дмитрий Казаков разберет эту тему без пафоса и абстрактных фраз. Вам расскажут, что стоит за data-driven подходом, какие реальные проблемы он решает и почему у компаний возникают сложности с внедрением. Это не про «как должно быть», а про «как бывает на самом деле» — со всеми шероховатостями, сопротивлением и типичными ошибками.
Спикер — Дмитрий Казаков, директор по аналитике Kolesa Group. 10+ лет опыта в data, BI и ML. Создает эксперименты, строит data-культуру и делится опытом с аналитиками как ментор и преподаватель.
Вебинар бесплатный и пройдет 27 ноября в 18:00 по МСК, присоединяйтесь по ссылке: https://clc.to/erid_2W5zFGNvuyA
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFGNvuyA
Photo unavailableShow in Telegram
Generative AI as a Linguistic Equalizer in Global Science
📚 Read
@datascienceiot
00:10
Video unavailableShow in Telegram
Конференция AI Driver & RecSys Темы — пространство, где наука и бизнес встречаются, чтобы обсудить будущее рекомендаций ⚡️
28 ноября пройдёт конференция о том, как создаются и развиваются современные рекомендательные системы.
На площадке Сбера соберутся эксперты топовых российских IT-компаний и вузов, чтобы обсудить новые исследования, открытые датасеты и практические решения, которые меняют подход к персонализации.
Это возможность за один день познакомиться с ключевыми трендами RecSys, пообщаться со специалистами и вдохновиться идеями, формирующими будущее рекомендаций.
Присоединяйтесь к профессиональному сообществу 28 ноября в 10:00 — регистрация по ссылке!
IMG_7804.MP43.50 MB
Photo unavailableShow in Telegram
Accelerate Large-Scale LLM Inference and KV Cache Offload with CPU-GPU Memory Sharing
📚 Read
