عصر گویش | هوش مصنوعی
Открыть в Telegram
2025 год в цифрах

111 648
Подписчики
-7724 часа
-7427 дней
-3 10330 день
Архив постов
📚 ابزار Reader3: یک ابزار مینیمال و الهامبخش برای خواندن کتاب با کمک LLM — اثر جدید آندری کارپاتی
آندری کارپاتی در گیتهاب خود یک پروژه بسیار ساده اما مفهومی با نام Reader3 منتشر کرده است؛ ابزاری سبکوزن برای خواندن کتابهای EPUB که در نگاه اول فقط یک «کتابخوان محلی» بهنظر میرسد—اما ایدۀ اصلی کاملاً متفاوت است.
✨ ایده پشت Reader3 چیست؟
ابزار Reader3 کتاب را فصلبهفصل نمایش میدهد و کاربر میتواند بهسادگی متن همان فصل را کپی کند و در مدل زبانی دلخواهش (مثلاً GPT یا Claude) قرار دهد تا:
🔸دربارهٔ داستان گفتگو کند،
🔸سبک نویسنده را تحلیل کند،
🔸یا پرسشهای عمیقتری دربارهٔ محتوا بپرسد.
بهگفتهٔ کارپاتی، خواندن همراه با LLM به یکی از روشهای اصلی مطالعه او تبدیل شده:
🔸یک بار خواندن دستی،
🔸یک بار خلاصه/توضیح LLM،
🔸یک دور پرسشوپاسخ.
این روش به او درک بسیار عمیقتری نسبت به خواندن کلاسیک میدهد.
🌿 فلسفهای که مهمتر از خود ابزار است
کارپاتی میگوید این پروژه ۹۰٪ سبک «vibe coding» است؛ یعنی فقط برای انتقال ایده نوشته شده و قصد ندارد آن را پشتیبانی یا توسعه دهد.
او مینویسد:
«کد الان یک چیز زودگذر است.»یعنی در دنیای امروز، دورهٔ کتابخانههای سخت، ایستا و نگهداریهای طولانی رو به پایان است. اگر چیزی را نمیپسندید، کافی است از LLM بخواهید کد را همانجا تغییر دهد—همین! 🧪 چطور امتحانش کنیم؟ فقط کافی است کتاب EPUB خود را آماده کنید و با استفاده از uv این دو فرمان را اجرا کنید:
uv run reader3.py yourbook.epub # سپس اجرای سرور: uv run server.py
سپس کتابخانهٔ شما در مرورگر روی آدرس زیر باز خواهد شد:
http://localhost:8123
📌 لایسنس:
MIT License
🖥 گیتهاب:
https://github.com/karpathy/reader3
#AI #ML #LLM #Karpathy #Github #Book
@asrgooyeshpardaz❤ 4✍ 1
🚀 ویژگیهای برجسته
✨ تأخیر بسیار پایین — در حد ۸۰ میلیثانیه
این مدل برای کاربردهای کاملاً برخط طراحی شده و با تأخیر بسیار کم، تجربهای نزدیک به مکالمه واقعی میان انسان و سامانه ارائه میکند.
🎤 تشخیص هوشمند پایان گفتار (End-of-Utterance)
مدل با استفاده از یک نشانهٔ اختصاصی <EOU> لحظهای که کاربر صحبت خود را به پایان میرساند مشخص میکند.
بهاینترتیب، سامانه دیگر منتظر سکوتهای طولانی نمیماند و میتواند واکنشهای سریع و طبیعیتری داشته باشد.
⚙️ معماری سبک و کارآمد
مدل Parakeet-Realtime-EOU-120M بر پایه معماری FastConformer-RNNT طراحی شده است؛
مدلی با ۱۲۰ میلیون پارامتر که با ساختار «کشـآگاه» بهینه شده و برای اجرا روی دستگاههای لبهای (Edge) بسیار مناسب است.
🤗هاگینگ فیس
@asrgooyeshpardaz
🔥 2❤ 1🆒 1
🚀 گوگل از مدل Gemini 3 Pro رونمایی کرد — غول Sparse-MoE با کانتکست 1M برای کارهای Agentic
گوگل امروز Gemini 3 Pro را معرفی کرد؛ یک مدل Sparse Mixture-of-Experts چندوجهی که برای استدلال طولانی، کدنویسی پیچیده و بارهای Agentic طراحی شده است.
این مدل ورودیهای متن، تصویر، صوت و ویدیو را یکپارچه پردازش میکند.
🔥 مهمترین ویژگیها
🧠 کانتکست ۱ میلیون توکن مناسب برای پروژههای چندفایلی و reasoning طولانی
⚙️ معماری Sparse MoE برای توان پردازشی بالاتر با هزینه کمتر
🤖 بهینهسازیشده برای Agentic Workloads (برنامهریزی چندمرحلهای، Tool Use، Multi-Agent)
🎛 کاملاً چندوجهی
💻 توان قویتر در کدنویسی و رفع اشکال
🏆 برتری بر GPT-5.1 و Claude 4.5
مدل Gemini 3 Pro در بنچمارکهای کلیدی زیر عملکرد بهتر داشته است:
📘 Humanity’s Last Exam
🧩 ARC AGI 2
💎 GPQA Diamond
➗ AIME 2025
🎓 MMMU Pro
🧩 محل استفاده
این مدل همین حالا در سرویسهای گوگل فعال است:
اپلیکیشن Gemini
AI Mode در جستجو
Gemini API
Vertex AI
محیط توسعه Agentic گوگل: Antigravity
📄 منابع رسمی
🔍 تحلیل کامل MarkTechPost
📑 گزارش ارزیابی مدل (PDF)
⚙️ جزئیات فنی و یادداشت CEO
@asrgooyeshpardaz
❤ 2🔥 2👍 1🤔 1🎉 1
🌐 تحولات تازه در دنیای هوش مصنوعی
🚀 شرکت Google کولب را به Visual Studio Code متصل کرد
شرکت Google افزونهای منتشر کرده است که ویرایشگر VS Code را مستقیماً به محیطهای اجرای Google Colab متصل میکند.
به این ترتیب، میتوانید روی فایلهای محلی .ipynb کار کنید اما اجرای کد را در Colab انجام دهید.
این افزونه هم از محیط رایگان و هم از Colab Pro پشتیبانی میکند.
برای شروع کافی است افزونهی Google Colab را از VS Code Marketplace نصب کنید. پس از انتخاب «هسته» (Kernel) برای نوتبوک، گزینهی «Colab» ظاهر میشود و سپس باید در حساب Google خود وارد شوید.
این افزونه همچنین در Open VSX Registry برای ویرایشگرهای سازگار منتشر شده است.
🔗 منبع:
developers.googleblog.com
📸 شرکت ByteDance مدل Depth Anything 3 را معرفی کرد
مدل Depth Anything 3 میتواند تنها با یک یا چند تصویر، هندسهای سهبعدی و سازگار با فضا را پیشبینی کند؛ حتی زمانی که پارامترهای دوربین مشخص نباشند.
ویژگی کلیدی این نسخه، سادهسازی شدید معماری است.
در پشتصحنه، یک ترنسفورمر واحد و یک نمایش یکپارچهی depth-ray قرار دارد. اکنون یک مدل واحد میتواند طیف وسیعی از وظایف را حل کند:
تخمین عمق تکچشمی
تعیین موقعیت دوربین
تولید مستقیم گاوسینهای سهبعدی برای خلق نماهای جدید
در آزمایشها، DA3 عملکرد نسخههای قبلی را پشت سر گذاشته است. تیم سازنده وزن مدلها، ابزار CLI و رابط کاربری وب مبتنی بر Gradio را منتشر کرده است.
🔗 وبسایت رسمی:
depth-anything-3.github.io
💴 شرکت Sakana AI به گرانترین «یونیکورن» ژاپن تبدیل شد
شرکت Sakana AI با جذب سرمایهای به ارزش ۲۰ میلیارد ین، اکنون ارزشی حدود ۲.۶۳۵ میلیارد دلار دارد و به گرانترین استارتاپ خصوصی در تاریخ ژاپن تبدیل شده است.
از جمله سرمایهگذاران: Mitsubishi UFJ Financial Group و چند صندوق آمریکایی سرمایهگذاری خطرپذیر.
این سرمایه برای توسعهی مدل زبانی اختصاصی (LLM) ویژهی زبان و فرهنگ ژاپنی استفاده خواهد شد.
شرکت Sakana AI هماکنون با MUFG و Daiwa Securities برای ساخت سامانههای هوش مصنوعی مالی همکاری میکند و در آینده قصد دارد وارد حوزههای دفاعی و صنعت تولید نیز شود.
🔗 گزارش نیکkei:
asia.nikkei.com
🛰 جف بزوس مدیریت یک استارتاپ هوش مصنوعی را برعهده گرفت
برای نخستینبار پس از کنارهگیری از سمت CEO آمازون، جف بزوس یک نقش عملیاتی جدید پذیرفته و بهعنوان هممدیر استارتاپ هوش مصنوعی Project Prometheus فعالیت میکند.
این شرکت ۶.۲ میلیارد دلار سرمایه جذب کرده است که بخشی از آن سرمایهگذاری شخصی بزوس است—رقمی که آن را به یکی از پردرآمدترین استارتاپهای اولیه تبدیل میکند.
مدیرعامل دوم، ویک باجاج، فیزیکدان و شیمیدانی است که در Google X روی پروژه Waymo کار کرده است.
استارتاپ Prometheus بر ساخت ابزارهای هوش مصنوعی تمرکز میکند تا فرآیندهای مهندسی و تولید در صنایع زیر را تسریع کند:
خودروسازی
هوافضا
سختافزارهای محاسباتی
این استارتاپ قصد دارد وارد بازار سیستمهای هوش مصنوعی مخصوص رباتیک، تحقیقات علمی و توسعه مواد شود.
با وجود فعالیت پشت درهای بسته، تیم آن اکنون حدود ۱۰۰ متخصص از OpenAI، DeepMind و شرکتهای مرتبط با مارک زاکربرگ را شامل میشود.
🔗 گزارش نیویورکتایمز:
nytimes.com
🧩 سناریوی «آینهٔ سیاه» در واقعیت: ساخت نسخه دیجیتال افراد درگذشته
بازیگر کالوم وورثی پلتفرم هوش مصنوعی 2wai را راهاندازی کرده است؛ سامانهای که نسخههای دیجیتال و تعاملی از افراد درگذشته ایجاد میکند.
برای ساخت چنین آواتاری، تنها چند دقیقه ویدئو از فرد کافی است. پس از پردازش، کاربران میتوانند با نسخه دیجیتال بستگان خود تعامل کنند—حتی در مراحل مختلف سن فرضی او.
این پروژه موجی از انتقادات ایجاد کرده و بسیاری آن را سوءاستفاده از غم بازماندگان و استفاده از تصویر افراد بدون رضایت آنها دانستهاند.
منتقدان میگویند چنین فناوریای روند طبیعی سوگواری را مختل میکند.
نسخه بتای برنامه اکنون در App Store در دسترس است و توسعهدهندگان قصد دارند نسخه اندروید و اشتراک پولی نیز عرضه کنند.
🔗 پست کالوم وورثی در X:
Calum Worthy در شبکه X
@asrgooyeshpardaz
❤ 4👍 2✍ 1🔥 1
⛔️ ابزار Heretic؛ ابزار جدید برای حذف خودکار سانسور از مدلهای زبانی
ابزار Heretic یک ابزار متنباز است که بدون هیچ تنظیمات پیچیدهای، رفتارهای سانسورگرانه و امتناع مدلهای زبانی را کاهش میدهد؛ آن هم بدون اینکه کیفیت یا هوش مدل آسیب جدی ببیند.
✨ ابزار Heretic چه کار میکند؟
الگوهای مسئول «امتناع» در لایههای مدل را شناسایی میکند
آنها را تضعیف میکند تا مدل کمتر «نه» بگوید
و با استفاده از Optuna بهترین پارامترها را کاملاً خودکار پیدا میکند
نتیجه: مدل آزادتر، روانتر و کمحرفکمنیاورتر.
📊 نتیجههای چشمگیر
روی مدل Gemma-3-12B-IT:
نسخه اصلی: ۹۷٪ امتناع
نسخههای دستی Abliteration: ۳٪
ابزار Heretic (خودکار): ۳٪ امتناع + کمترین افت کیفیت
یعنی خروجی Heretic هم آزاد است، هم باهوش.
🧪 نصب و استفاده
کافی است PyTorch نصب باشد:
pip install heretic-llm heretic Qwen/Qwen3-4B-Instruct-2507
(نام مدل را میتوانید عوض کنید.)
ابزار Heretic خودش سختافزار را تست میکند، مدل را پردازش میکند و در پایان امکان ذخیره یا تست مدل را میدهد.
✅ پشتیبانی
مدلهای Dense و بسیاری از مدلهای چندمودالی
برخی MoEها
(فعلاً نه برای SSMها و معماریهای خاص)
🎯 جمعبندی
ابزار Heretic یک ابزار ساده و قدرتمند برای کاهش سانسور در مدلهای باز است؛
بدون ریترینینگ، بدون تنظیمات پیچیده، و با کمترین آسیب به توانایی مدل.
🔗 لینک پروژه:
https://github.com/p-e-w/heretic
@asrgooyeshpardaz👏 4❤ 1🔥 1
📊 معرفی DS-STAR؛ نسل جدید ایجنتهای خودکار برای Data Science
🚀 گوگل از DS-STAR رونمایی کرد؛ ایجنتی که میتواند بسیاری از مراحل تحلیلی و مهندسی داده را بهصورت تمامخودکار انجام دهد: از آمار و بصریسازی گرفته تا پیشپردازش و ساخت مدلهای ML.
🔍 ویژگیهای کلیدی
• پشتیبانی از انواع داده (CSV، JSON، متن، Markdown) 📁
• اجرای چرخهی Plan → Code → Verify برای حل هر مسئله 🔄
• بهبود تدریجی راهحل با کمک LLM-Verifier برای جلوگیری از خطاها ✅
🏆 نتایج و بنچمارکها
• رکورد جدید در DABStep با امتیاز 45.2٪ (در برابر 41.0٪ قبلی) 🥇
• عملکرد برتر روی KramaBench و DA-Code
• توانایی ویژه در سناریوهای پیچیده و چندمرحلهای 📈
💡 چرا مهم است؟
عامل DS-STAR بسیاری از کارهای وقتگیر و تخصصی Data Science را خودکار میکند و تحلیلهای پیچیده را برای تیمها سریعتر، ارزانتر و قابلاعتمادتر میسازد.
🔗 منبع:
https://research.google/blog/ds-star-a-state-of-the-art-versatile-data-science-agent/
#DataScience #AI #Google #Automation
@asrgooyeshpardaz
🔥 1👨💻 1
☀️ گوگل دیپمایند نسخهی جدید سیستم پیشبینی هوای خود را معرفی کرد: WeatherNext 2
مدل جدید WeatherNext 2 پیشرفتهترین سیستم هوشمند DeepMind برای پیشبینی سریعتر، دقیقتر و قابلاعتمادتر وضعیت آبوهوا است. مهمترین ویژگیهای آن:
⚡️ ۸ برابر سریعتر
مدل WeatherNext 2 میتواند پیشبینیهای جوی را با سرعتی بسیار بیشتر نسبت به نسل قبلی تولید کند.
🎯 دقت بالاتر با تفکیکپذیری ساعتی
این مدل تا تفکیکپذیری یکساعته را پشتیبانی میکند و در ۹۹.۹٪ پارامترها عملکرد بهتری نسبت به نسخهی پیشین دارد.
🌪 تولید صدها سناریوی احتمالی
مدل قادر است صدها مسیر آبوهوایی جایگزین، از جمله سناریوهای شدید مثل طوفانها، موجهای گرما یا بارندگیهای ناگهانی را شبیهسازی کند. این قابلیت برای برنامهریزی، مدیریت بحران و تحلیل ریسک فوقالعاده مهم است.
🛰 کاربرد در محصولات گوگل
مدل WeatherNext 2 اکنون در Google Search، Gemini و Google Maps استفاده میشود و کیفیت پیشبینیها را برای کاربران در جهان بالا میبرد.
🗂 دسترسی برای توسعهدهندگان
دادههای این مدل از طریق Earth Engine و BigQuery در اختیار پژوهشگران و توسعهدهندگان قرار گرفته است.
🌍 پیشبینی هوا با کمک هوش مصنوعی هر روز دقیقتر و سریعتر میشود — و WeatherNext 2 یکی از بزرگترین جهشها در این مسیر است.
🔗 لینک منبع:
https://blog.google/technology/google-deepmind/weathernext-2/
#AI #Google #DeepMind #Weather
@asrgooyeshpardaz
⚡ 2❤ 1🔥 1
📌 بزرگترین موج اخراج نیروی کار در آمریکا طی ۲۲ سال گذشته — اکتبر ۲۰۲۵
بر اساس گزارش تازهی Challenger, Gray & Christmas، شرکتهای آمریکایی در اکتبر ۲۰۲۵ اعلام کردهاند که ۱۵۳ هزار نفر را اخراج میکنند — رقمی که:
۱۷۵٪ بیشتر از اکتبر پارسال است
۱۸۳٪ بیشتر از ماه قبل
و بیشترین میزان اخراج در ماه اکتبر از سال ۲۰۰۳ تاکنون
از ابتدای سال ۲۰۲۵ تاکنون، مجموع تعدیلها از ۱ میلیون نفر عبور کرده است.
🔍 عاملان موج تعدیلها: اقتصاد، رفتار مصرفی، و هوش مصنوعی
در کنار کاهش هزینههای مصرفکنندگان و شرکتها، یک عامل مهم دیگر نیز وجود دارد: هوش مصنوعی.
فقط در ماه اکتبر، بیش از ۳۱٬۰۰۰ شغل به طور مستقیم به دلیل اتوماسیون مبتنی بر AI حذف شد.
از ابتدای سال این رقم به بیش از ۴۸ هزار شغل رسیده است.
💻 فشار سنگین روی بخش فناوری
حتی خود صنعت فناوری که خالق ابزارهای AI است نیز در وضعیت دشواری قرار دارد:
در اکتبر: ۳۳ هزار اخراج
در کل سال: ۱۷٪ افزایش نسبت به دوره مشابه سال ۲۰۲۴
📦 رکورددار اخراج: انبارداری و لجستیک
بخش Warehouse & Logistics با ۴۷ هزار اخراج در اکتبر، بالاترین تعداد تعدیل را ثبت کرده است.
گزارش Challenger دلیل اصلی این موج را شتاب بیسابقه در اتوماسیون و رباتیک میداند.
🔻 وضعیت استخدام هم کمسابقه است
در حالی که اخراجها افزایش یافتهاند، نرخ استخدام جدید نیز:
۳۵٪ کمتر از سال گذشته است
و به کمترین سطح از سال ۲۰۱۱ رسیده
حتی استخدام فصلی نیز به پایینترین سطح از سال ۲۰۱۲ تا امروز سقوط کرده است.
🧩 جمعبندی
بازار کار آمریکا وارد دورهای از «بازتنظیم ساختاری» شده:
ترکیب رکود هزینهها + اصلاحات پساکرونا + شتابگیری اتوماسیون و AI → بزرگترین موج تعدیل از ۲۰۰۳.
این روند احتمالاً در سال ۲۰۲۶ نیز ادامهدار خواهد بود.
#news #ai
@asrgooyeshpardaz
❤ 7😨 2👍 1🔥 1🤔 1
5⃣ مقایسهٔ پنج معماری برتر عاملهای هوشمند در سال ۲۰۲۵: سلسلهمراتبی، ازدحامی، فراگیر، ماژولار و تکاملی
این مقاله پنج معماری کلیدی عاملهای هوشمند را که بهطور فعال در سال ۲۰۲۵ مورد استفاده قرار میگیرند، مقایسه میکند.
۱) عاملهای شناختی سلسلهمراتبی (Hierarchical Cognitive Agents)
این معماری از کنترل لایهلایه استفاده میکند—ویژهٔ رباتیک و سامانههای صنعتی—و حلقههای واکنشی سریع را از لایههای تفکر، تصمیمگیری و مدیریت اهداف بلندمدت جدا میسازد. این جداسازی باعث افزایش پایداری، اطمینان و قابلیت تبیین در سیستمهایی میشود که به همزمانی حسگری، کنترل بلادرنگ و برنامهریزی نیاز دارند.
۲) عاملهای هوشمند ازدحامی (Swarm Intelligence Agents)
در این الگو تعداد زیادی عامل ساده با استفاده از قواعد محلی هماهنگ میشوند و رفتار جمعی قدرتمند، مقاوم و مقیاسپذیر ایجاد میکنند. این روش برای پهپادها، لجستیک، مدیریت ناوگان و شبیهسازیهای شبهجمعیت (crowd-like) بسیار کاربردی است، زیرا بدون نیاز به یک کنترلکننده مرکزی میتواند پاسخهای هماهنگ و تطبیقی تولید کند.
۳) عاملهای فراگیر یا فرایادگیر (Meta-Learning Agents)
در این معماری یادگیریِ وظیفه از یادگیریِ «چگونه یاد گرفتن» جدا میشود. نتیجهٔ این جداسازی، توانایی تطبیق سریع با وظایف جدید، شخصیسازی رفتاری، و استفاده از تجربهٔ انباشته روی وظایف مرتبط است. این عاملها در محیطهای پویا که دادهها یا اهداف بهسرعت تغییر میکنند عملکردی در سطح بسیار بالا ارائه میدهند.
۴) عاملهای ماژولارِ خودسازمانده (Self-Organizing Modular Agents)
در این الگو، ماژولهایی برای ادراک، حافظه، استدلال، و فراخوانی ابزارها با یک ارکستراتور مرکزی همبندی (orchestrate) میشوند. این ساختار کاملاً با معماری عاملهای مبتنی بر LLM امروزی تطابق دارد، جایی که مدلهای زبانی بزرگ با APIها، ابزارها، محیطها و پایگاههای داده تعامل میکنند. این معماری باعث انعطافپذیری بالا و توسعهٔ تدریجی سیستم میشود.
۵) عاملهای تکاملیِ مبتنی بر برنامهٔ درسی (Evolutionary Curriculum Agents)
این معماری شامل آموزشِ جمعیتها در برابر توزیعهای تکاملیِ وظایف است—ترکیبی از curriculum learning و جستوجوی تکاملی. نتیجهٔ آن کشف راهبردهای متنوع برای حل مسائل پیچیده، بهویژه در محیطهای چندعاملی و بازیمحور است. تنوع رفتاری حاصل، سیستم را از بنبستهای محلی نجات میدهد و نوآوری حل مسئله را افزایش میدهد.
جمعبندی
این پنج الگو با هم جعبهابزاری برای مهندسان فراهم میکنند که میتوانند هنگام طراحی سیستمهای عاملمحور واقعی، بسته به نیاز، آنها را با یکدیگر ترکیب و استفاده کنند.
این معماریها—از کنترل سلسلهمراتبی گرفته تا هوش ازدحامی، فرایادگیری، سازماندهی ماژولار، و تکامل مبتنی بر برنامهٔ درسی—نشان میدهند که طراحی عاملهای هوشمند در ۲۰۲۵ فراتر از یک رویکرد واحد بوده و به سوی سیستمهای ترکیبی، چندلایه و سازگار حرکت کرده است.
🔗منبع
@asrgooyeshpardaz
❤ 1👍 1🔥 1🤯 1
🕵♀ جاسوسی سایبری با هوش مصنوعی: افشای نخستین حمله هکری خودمختار توسط Anthropic
🔍 بر اساس گزارش جدید Anthropic، یک گروه هکری با نام GTG-1002 (احتمالاً وابسته به چین) از Claude Code برای اجرای حملات سایبری تقریباً بدون دخالت انسانی استفاده کرده است.
هدفها بیش از ۳۰ سازمان بودهاند: شرکتهای فناوری اطلاعات، نهادهای دولتی و بانکها.
⚙️ هوش مصنوعی بهصورت خودکار این مراحل را انجام داده است:
• شناسایی و جستوجوی آسیبپذیریها 🕵️
• نفوذ و جابهجایی در شبکهها 🕸
• جمعآوری و تحلیل دادهها 📊
📈 میزان خودمختاری حمله به ۸۰ تا ۹۰ درصد رسیده و نقش انسان تقریباً به تأیید مراحل کلیدی محدود شده است.
⚠️ چالش جدی: گاهی مدل دچار «توهم» میشده و از موفقیتهای خیالی گزارش ارائه میداده است.
🛡 شرکت Anthropic این حمله را شناسایی و متوقف کرده، سامانههای دفاعی را تقویت نموده و به نهادهای هدف نیز اطلاعرسانی کرده است.
🚨 جمعبندی: هوش مصنوعی اکنون آستانه ورود به حملات پیچیده سایبری را بهشدت پایین آورده و سطح تهدیدات را وارد مرحلهای تازه کرده است.
🔗 منبع:
https://www.anthropic.com/news/disrupting-AI-espionage
#AI #CyberSec #Anthropic
@asrgooyeshpardaz
❤ 1🔥 1🥰 1👏 1😡 1
🔥 مدل Pelican-VL: قدرتمندترین مغز رباتهای جهان – کاملاً متنباز!
چین از قویترین مدل متنباز برای رباتها رونمایی کرد.
مدل Pelican-VL 1.0 از مرکز نوآوری رباتهای انساننمای پکن نهتنها عملکردی در حد سامانههای بستهی Google و NVIDIA دارد، بلکه بهطور کامل متنباز است.
🤖 مدل Pelican-VL چیست؟
یک مدل بینایی–زبانی (VLM) ویژهی هوش تجسمیافته (Embodied AI)؛ یعنی همان «مغز»ی که ربات با آن محیط را میبیند، میفهمد و عمل میکند.
🧠 روش انقلابی آموزش: DPPO
روش Deliberate Practice Policy Optimization با ایدهی «تمرین آگاهانه»:
🔸تحلیل ویدئو
🔸تمرین خودکار
🔸یافتن خطا
🔸اصلاح و بهبود مدل
مثل دانشجویی که مدام از اشتباهاتش یاد میگیرد و حرفهایتر میشود.
🚀 توانمندیها
• فهم همزمان متن و تصویر
• استدلال فضایی–زمانی
• برنامهریزی حرکتی ربات و کنترل تعامل فیزیکی
• خوداصلاحی برای برطرفکردن نقاط ضعف
📊 مشخصات فنی
دو اندازه: 7B و 72B
بیش از 1000 GPU A800
حدود 50,000 GPU-hours آموزش
🌍 مقایسه جهانی
در حالیکه Gemini Robotics و Cosmos-Reason1 همچنان بستهاند،
مدل Pelican-VL یک آلترناتیو کاملاً باز ارائه میدهد؛
با بهرهوری داده ۱۰ تا ۵۰ برابر بهتر از نمونههای رقیب.
🔗 منابع:
🌐 وبسایت رسمی
💻 GitHub
🤗 HuggingFace
@asrgooyeshpardaz
❤ 2🏆 2🔥 1👏 1🗿 1
🌐 تحولات تازه در دنیای هوش مصنوعی
⚡️ دسترسی API به GPT-5.1 فعال شد
شرکت OpenAI نسخه جدید مدل خود را در API ارائه کرد؛ قابلیت مهم این نسخه تفکر تطبیقی (Adaptive Reasoning) است:
برای کارهای ساده سریع پاسخ میدهد و برای مسائل پیچیده وارد تحلیل عمیق میشود. همچنین حالت بدون تفکر برای پاسخهای فوری اضافه شده است.
🛠 ابزارهای جدید توسعهدهندگان:
• ابزار apply_patch — ویرایش کد بهصورت پچ
• ابزار shell — اجرای امن دستورات در محیط محلی
• کش ۲۴ ساعته پرامپتها برای پاسخدهی بسیار سریع در یک سشن
🔗 جزئیات کامل – OpenAI
🧱 ابزار LangChain Sandboxes — اجرای ایمن کد برای ایجنتها
چارچوب LangChain قابلیت Sandboxes for DeepAgents را معرفی کرد:
محیطهای ایزولهای که اجازه میدهند کد تولیدشده توسط ایجنتها بدون خطر برای سیستم اصلی اجرا شود.
مزایا:
• 🧩 محیطهای تمیز با وابستگیهای دقیق
• 🛡 محافظت از سیستم محلی در برابر کد مخرب
• ⚙️ اجرای همزمان چند ایجنت
• 🚀 مناسب برای عملیات سنگین و طولانیمدت
🔗 پست رسمی – LangChain
🖼 مدل Photoroom مدل متنبهتصویر PRX را بهصورت متنباز منتشر کرد
نسل دوم مدل Photoroom اکنون کاملاً اوپنسورس است. سه نسخه منتشر شده: Base، SFT و Distilled.
ویژگیهای کلیدی:
• 📐 رزولوشنهای 256 و 512 + نسخه آزمایشی 1024
• ⚙️ ۱.۳ میلیارد پارامتر
• ⚡️ آموزش کمتر از ۱۰ روز روی ۳۲×H200
• 🔬 معماری مبتنی بر MMDiT + Flux VAE + T5-Gemma
دمو و مدلها:
🔗 دموی 1024 روی HuggingFace
🔗 مجموعه مدلها روی HuggingFace
🔗 پست مدیرعامل در X
🦊 مرورگر Firefox قابلیت AI Window را معرفی کرد
مرورگر Mozilla ویژگی جدید AI Window را رونمایی کرد؛ یک پنجره هوشمند برای تعامل با دستیار AI هنگام مرور وب.
تمرکز اصلی روی کنترل کامل کاربر و حفظ حریم خصوصی است — این قابلیت کاملاً اختیاری است.
🔗 ثبتنام برای دسترسی اولیه
🔗 پست رسمی موزیلا
📚 ابزار NotebookLM بروزرسانی بزرگ گرفت — قابلیت Deep Research فعال شد
نسخه جدید NotebookLM اکنون یک ایجنت تحقیقی داخلی دارد:
• 🔍 طرح تحقیق میچیند
• 🌐 منابع آنلاین را تحلیل میکند
• 🧾 گزارش ساختاریافته با تمام منابع تولید میکند
• 📥 امکان افزودن مستقیم منابع به Workspace
پشتیبانی جدید:
• Google Sheets
• Microsoft Word
• بارگذاری تصویر
• درج فایل از Google Drive با لینک
🔗 جزییات کامل – Google Blog
@asrgooyeshpardaz
🔥 2👏 1🎉 1
02:19
Видео недоступноПоказать в Telegram
🤖 رباتهای انساننما وارد خانهها میشوند!
شرکت Shenzhen MindOne Robotics در حال آزمایش «مغز رباتی» خود روی Unitree G1 است و دموهای جدید واقعا شگفتانگیز شدهاند.
ربات G1 الآن کارهای کاملاً خانگی و انسانی انجام میدهد:
🌱 آبیاری گیاهان
📦 جابهجایی و حمل جعبهها
🧼 تمیزکردن تشک و سطوح
🧹 مرتبسازی اتاق و انجام کارهای روتین
… و کلی وظیفهی دیگر که تا همین چند وقت پیش فقط انسان از پسشان برمیآمد.
با این سرعت پیشرفت، واقعاً بهنظر میرسد رباتهای خانگی انساننما خیلی زود مثل ماشین ظرفشویی یا جاروبرقی، یک وسیلهی معمولی در هر خانه میشوند.
@asrgooyeshpardaz
13.82 MB
👍 3🔥 2🙈 1
🔥 پشتیبانی رسمی از Sparse Inference در کتابخانه PyTorch
کتابخانه PyTorch اکنون بهصورت رسمی از استنتاج کمتراکم (Sparse Inference) پشتیبانی میکند؛ رویکردی که
مصرف حافظه را کاهش میدهد و سرعت اجرا را افزایش میدهد—آن هم بدون تغییر در معماری مدل.
🧠 توضیح Sparse Inference
در مدلهای عصبی، پس از Pruning یا حذف ساختاری، بخش بزرگی از وزنها و اکتیویشنها صفر میشوند.
این ماتریسهای پراکنده (Sparse) اگر بهدرستی بهینهسازی شوند، میتوانند سرعت استنتاج را چند برابر افزایش دهند.
کتابخانه PyTorch این قابلیت را اکنون بهصورت استاندارد و یکپارچه ارائه میکند.
⚙️ چه قابلیتهایی اضافه شده است؟
🔢 پشتیبانی از الگوهای N:M sparsity مثل 2:4
⚡ سرعت استنتاج بیشتر روی GPU و CPU
🔁 پشتیبانی کامل از torch.compile و torch.export
🧩 ادغام با TorchInductor برای بهینهسازی خودکار
🔍 جریان کار چگونه است؟
🔹اعمال Pruning یا Structured Sparsity
🔹تبدیل مدل به فرم sparse با:
torch.sparse.to_sparse()
یا مسیر torch.export
🔹اجرای سریع از طریق:
ابزار XNNPACK روی CPU
ابزار CUTLASS روی GPUهای Ampere+
💡 چرا اهمیت دارد؟
📉 مصرف حافظه کمتر 👈 latency پایینتر در دستگاههای لبهای
🚀 افزایش سرعت بدون افت کیفیت
🔧 یکپارچه با کل اکوسیستم PyTorch
📦 مناسب برای استنتاج محلی، موبایل، IoT و مدلهای بزرگ
🔗 لینک رسمی PyTorch
https://pytorch.org/blog/beyond-quantization-bringing-sparse-inference-to-pytorch/
@asrgooyeshpardaz🔥 1👨💻 1
🚀 شرکت NVIDIA مدل جدید Llama-3 Nemotron Super-49B-v1.5-NVFP4 را منتشر کرد
انویدیا نسخهای بهینهسازیشده و قدرتمند از خانوادهٔ Llama-3.3 را عرضه کرده است؛ یک مدل ۴۹ میلیارد پارامتریِ مخصوص استدلال (Reasoning) که برای بارهای کاری واقعی Agentic AI طراحی شده است.
✨ چه چیزهایی بهتر شده است؟
• 🧠 بهبود توان استدلال نسبت به Llama-3.3-70B-Instruct
• 🛠 استفادهٔ دقیقتر از ابزارها (Tool Calling)
• 📝 گفتوگوهای پایدار در کانتکستهای بسیار طولانی
• 📚 پشتیبانی از 128K Context برای نگهداری همزمانِ مکالمات طولانی، اسناد حجیم و زنجیرههای اقدام پیچیده بدون نیاز به چانککردن
⚙️ نکتهٔ کلیدی این نسخه: NAS
شرکت NVIDIA از Neural Architecture Search برای طراحی معماری بهینه استفاده کرده است؛ نتیجه:
• 🔋 مصرف حافظه بهطور چشمگیری کمتر شده است
• ⚡️ بهرهوری و Throughput بالاتر رفته است
• 💡 توان اجرای کارهای سنگین روی یک GPU مدل H200 حتی زیر بارهای بزرگ فرآهم شده است
• 📈 امکان استفاده از بچهای بزرگتر و هزینهٔ سروینگ کمتر وجود دارد
🔗 مدل در HuggingFace:
https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-v1_5-NVFP4
@asrgooyeshpardaz
🔥 1🤝 1
🚀 گروه Qwen نسخه جدید DeepResearch 2511 را منتشر کرد
این بهروزرسانی مجموعهای از قابلیتهای مهم برای انجام تحقیق عمیق و کنترلشده ارائه میدهد:
✨ دو حالت تحقیق
🔸حالت Normal: سریع و عمومی برای اکثر کاربردها
🔸حالت Advanced: زمان تحلیل بیشتر برای ارائهٔ بررسی عمیقتر و دقیقتر
📄 پشتیبانی از فایلها
اکنون میتوانید سندها و تصاویر را مستقیماً وارد مدل کنید تا در تحلیل استفاده شوند.
⚡ جستوجوی پیشرفتهتر
موتور جستوجوی جدید سریعتر است و اطلاعات وب را هوشمندانهتر پردازش میکند.
📊 کنترل کامل روی گزارشها
امکان تعیین ساختار خروجی:
حجم، تعداد پاراگرافها، قالببندی و میزان جزئیات.
سیستم نقلقول و استناد نیز دقیقتر شده است.
🧑💻 تجربهکاربری جدید (UX)
معماری تازه باعث سرعت بیشتر و واکنشپذیری بهتر محیط کار شده است.
🔗 وباپ:
https://chat.qwen.ai/?inputFeature=deep_research
📱 اپلیکیشن:
https://qwen.ai/download
#qwen #DeepResearch #AI
@asrgooyeshpardaz
❤ 3🔥 2👍 1👏 1💯 1
🔬سامانه AlphaResearch — رقیب چینی برای AlphaProof؟
گروهی از پژوهشگران دانشگاه Tsinghua، دانشگاه Yale و ByteDance سامانهای پژوهشمحور به نام AlphaResearch معرفی کردهاند؛ یک «عامل خودمختار پژوهشی» که از مدلهای زبانی برای کشف الگوریتمهای جدید استفاده میکند.
📌 معماری ارزیابی دوگانه
مدل داوری (RM): آموزشدیده بر پایهی نقدهای داوران ICLR با دقت ۷۲٪
صحتسنجی کد: اجرای برنامه برای تضمین درستی راهحلها
🏆 دستاوردهای کلیدی
ثبت رکورد جدید جهانی در مسئلهی Packing Circles برای n=32
(بهبود مقدار: 2.939 در برابر 2.936 بهترین رکورد انسانی)
کسب ۲ پیروزی از ۸ مورد در بنچمارک AlphaResearchComp
قابلیت بهبود خودکار ایدهها در چرخههای تکراری
⚠️ چالشها
در ۶ مورد از ۸ وظیفه، عملکرد انسان همچنان بهتر بود
دشواری در بهبود راهحلهای تولیدشده توسط انسان
💡 جمعبندی هوش مصنوعی اکنون قادر است الگوریتمهای جدید کشف کند، اما فاصلهی قابلتوجهی تا تحقیقات کاملاً خودمختار باقی مانده است. بااینحال انتشار عمومی کد و دادهها میتواند مسیر تحقیقات بازتولیدپذیر را تسریع کند.
🔗 مقاله:
https://arxiv.org/abs/2511.08522
🔗 کد و دیتاست:
https://github.com/answers111/alpha-research
#AI #ByteDance #Research #Tsinghua #AutonomousAgents
@asrgooyeshpardaz
😎 2❤ 1👍 1🔥 1
🔬سامانه AlphaResearch — رقیب چینی برای AlphaProof؟
گروهی از پژوهشگران دانشگاه Tsinghua، دانشگاه Yale و ByteDance سامانهای پژوهشمحور به نام AlphaResearch معرفی کردهاند؛ یک «عامل خودمختار پژوهشی» که از مدلهای زبانی برای کشف الگوریتمهای جدید استفاده میکند.
📌 معماری ارزیابی دوگانه
مدل داوری (RM): آموزشدیده بر پایهی نقدهای داوران ICLR با دقت ۷۲٪
صحتسنجی کد: اجرای برنامه برای تضمین درستی راهحلها
🏆 دستاوردهای کلیدی
ثبت رکورد جدید جهانی در مسئلهی Packing Circles برای n=32
(بهبود مقدار: 2.939 در برابر 2.936 بهترین رکورد انسانی)
کسب ۲ پیروزی از ۸ مورد در بنچمارک AlphaResearchComp
قابلیت بهبود خودکار ایدهها در چرخههای تکراری
⚠️ چالشها
در ۶ مورد از ۸ وظیفه، عملکرد انسان همچنان بهتر بود
دشواری در بهبود راهحلهای تولیدشده توسط انسان
💡 جمعبندی هوش مصنوعی اکنون قادر است الگوریتمهای جدید کشف کند، اما فاصلهی قابلتوجهی تا تحقیقات کاملاً خودمختار باقی مانده است. بااینحال انتشار عمومی کد و دادهها میتواند مسیر تحقیقات بازتولیدپذیر را تسریع کند.
🔗 مقاله:
https://arxiv.org/abs/2511.08522
🔗 کد و دیتاست:
https://github.com/answers111/alpha-research
#AI #ByteDance #Research #Tsinghua #AutonomousAgents
@asrgooyeshpardaz
🌟 استارتاپ World Labs دسترسی عمومی به Marble را باز کرد
استارتاپ World Labs نسخه عمومی Marble، مدل مولد World Model خود را منتشر کرد.
مدل Marble اکنون روی یک پلتفرم اختصاصی در دسترس است و امکان ساخت صحنههای سهبعدی دقیق را فراهم میکند — از طریق:
📝 متن
🖼 یک یا چند تصویر
🎞 ویدئوهای کوتاه
📐 ماکتهای ساده 3D
🎨 ابزار Chisel: ویژگی منحصربهفرد Marble
این ابزار اجازه میدهد ساختار و سبک را از هم جدا کنید:
شما هندسه فضا را با اشکال ابتدایی 3D مشخص میکنید، و مدل — با یک پرامپت متنی — ظاهر، نور، بافت و سبک هنری را تولید میکند.
⚙️ قابلیتهای پیشرفته Marble
✏️ ویرایش تعاملی (Interactive Editing)
🔄 گسترش بدون درز فضاهای ایجادشده
🧩 ترکیب چند جهان در یک صحنه
📤 خروجیها
نتایج را میتوان در قالبهای زیر دانلود کرد:
🔸قالب Gaussian Splats
🔸مشهای چندضلعی (Polygon Meshes)
🔸ویدئو
📄 خبر اصلی:
https://www.worldlabs.ai/blog/marble-world-model
#news #ai
@asrgooyeshpardaz
🤝 3🔥 1
👾 عامل SIMA 2: همراهِ هوشمند گوگل برای دنیای بازیها
گوگل دیپمایند نسخه جدید عامل embodied خود را معرفی کرد؛ مدلی که میتواند در کنار کاربر در دنیای سهبعدی بازیها ببیند، فکر کند، یاد بگیرد و عمل کند.
🔍 قابلیتهای جدید SIMA 2
🧠 استدلال پیشرفته (Gemini-Powered)
نسخه دوم اکنون بر پایه خانواده مدلهای Gemini کار میکند؛ یعنی میتواند اهداف پیچیده را درک کند، درباره تصمیمهایش توضیح بدهد و حتی در طول بازی با کاربر گفتگو کند.
🎯 یادگیری خودکار
عامل SIMA 2 بدون نیاز به نظارت انسانی، مهارتهایش را ارتقا میدهد. هر چه بیشتر بازی کند، هوشمندتر میشود.
🌍 سازگاری با دنیای جدید
این عامل میتواند در بازیهای ناآشنا مثل ASKA و MineDojo و حتی دنیاهای ساختهشده توسط هوش مصنوعی مانند Genie 3 حرکت کند و وظایف مختلف را انجام دهد.
📈 عملکرد بهتر نسبت به نسخه قبل
در بسیاری از وظایف، فاصله عملکرد SIMA با انسان نسبت به نسخه ۱ بهطور چشمگیری کاهش یافته است. این یعنی یک گام جدی به سمت ساخت عاملهای چندمهارتی که در آینده میتوانند در رباتیک دنیای واقعی هم نقش ایفا کنند.
🔒 وضعیت انتشار
فعلاً SIMA 2 در مرحله Limited Preview قرار دارد.
🔗 منبع رسمی (گوگل دیپمایند)
#AI #SIMA2 #Google #DeepMind
@asrgooyeshpardaz
🔥 1🎉 1
