ar
Feedback
عصر گویش | هوش مصنوعی

عصر گویش | هوش مصنوعی

الذهاب إلى القناة على Telegram

مجله هوش مصنوعی عصر گویش 021 61931000

إظهار المزيد
2025 عام في الأرقامsnowflakes fon
card fon
111 648
المشتركون
-7724 ساعات
-7427 أيام
-3 10330 أيام
أرشيف المشاركات
📚 ابزار Reader3: یک ابزار مینیمال و الهام‌بخش برای خواندن کتاب با کمک LLM — اثر جدید آندری کارپاتی آندری کارپاتی در گیت‌هاب خود یک پروژه بسیار ساده اما مفهومی با نام Reader3 منتشر کرده است؛ ابزاری سبک‌وزن برای خواندن کتاب‌های EPUB که در نگاه اول فقط یک «کتاب‌خوان محلی» به‌نظر می‌رسد—اما ایدۀ اصلی کاملاً متفاوت است. ✨ ایده پشت Reader3 چیست؟ ابزار Reader3 کتاب را فصل‌به‌فصل نمایش می‌دهد و کاربر می‌تواند به‌سادگی متن همان فصل را کپی کند و در مدل زبانی دلخواهش (مثلاً GPT یا Claude) قرار دهد تا: 🔸دربارهٔ داستان گفتگو کند، 🔸سبک نویسنده را تحلیل کند، 🔸یا پرسش‌های عمیق‌تری دربارهٔ محتوا بپرسد. به‌گفتهٔ کارپاتی، خواندن همراه با LLM به یکی از روش‌های اصلی مطالعه‌ او تبدیل شده: 🔸یک بار خواندن دستی، 🔸یک بار خلاصه/توضیح LLM، 🔸یک دور پرسش‌وپاسخ. این روش به او درک بسیار عمیق‌تری نسبت به خواندن کلاسیک می‌دهد. 🌿 فلسفه‌ای که مهم‌تر از خود ابزار است کارپاتی می‌گوید این پروژه ۹۰٪ سبک «vibe coding» است؛ یعنی فقط برای انتقال ایده نوشته شده و قصد ندارد آن را پشتیبانی یا توسعه دهد. او می‌نویسد:
«کد الان یک چیز زودگذر است.»
یعنی در دنیای امروز، دورهٔ کتابخانه‌های سخت، ایستا و نگهداری‌های طولانی رو به پایان است. اگر چیزی را نمی‌پسندید، کافی است از LLM بخواهید کد را همان‌جا تغییر دهد—همین! 🧪 چطور امتحانش کنیم؟ فقط کافی است کتاب EPUB خود را آماده کنید و با استفاده از uv این دو فرمان را اجرا کنید:
uv run reader3.py yourbook.epub # سپس اجرای سرور: uv run server.py 
سپس کتابخانهٔ شما در مرورگر روی آدرس زیر باز خواهد شد: http://localhost:8123 📌 لایسنس: MIT License 🖥 گیت‌هاب: https://github.com/karpathy/reader3 #AI #ML #LLM #Karpathy #Github #Book @asrgooyeshpardaz
إظهار الكل...
4 1
🚀 ویژگی‌های برجستهتأخیر بسیار پایین — در حد ۸۰ میلی‌ثانیه این مدل برای کاربردهای کاملاً برخط طراحی شده و با تأخیر بسیار کم، تجربه‌ای نزدیک به مکالمه واقعی میان انسان و سامانه ارائه می‌کند. 🎤 تشخیص هوشمند پایان گفتار (End-of-Utterance) مدل با استفاده از یک نشانهٔ اختصاصی <EOU> لحظه‌ای که کاربر صحبت خود را به پایان می‌رساند مشخص می‌کند. به‌این‌ترتیب، سامانه دیگر منتظر سکوت‌های طولانی نمی‌ماند و می‌تواند واکنش‌های سریع و طبیعی‌تری داشته باشد. ⚙️ معماری سبک و کارآمد مدل Parakeet-Realtime-EOU-120M بر پایه معماری FastConformer-RNNT طراحی شده است؛ مدلی با ۱۲۰ میلیون پارامتر که با ساختار «کش‌ـآگاه» بهینه شده و برای اجرا روی دستگاه‌های لبه‌ای (Edge) بسیار مناسب است. 🤗هاگینگ فیس @asrgooyeshpardaz
إظهار الكل...
🔥 2 1🆒 1
🚀 گوگل از مدل Gemini 3 Pro رونمایی کرد — غول Sparse-MoE با کانتکست 1M برای کارهای Agentic گوگل امروز Gemini 3 Pro را معرفی کرد؛ یک مدل Sparse Mixture-of-Experts چندوجهی که برای استدلال طولانی، کدنویسی پیچیده و بارهای Agentic طراحی شده است. این مدل ورودی‌های متن، تصویر، صوت و ویدیو را یکپارچه پردازش می‌کند. 🔥 مهم‌ترین ویژگی‌ها 🧠 کانتکست ۱ میلیون توکن مناسب برای پروژه‌های چندفایلی و reasoning طولانی ⚙️ معماری Sparse MoE برای توان پردازشی بالاتر با هزینه کمتر 🤖 بهینه‌سازی‌شده برای Agentic Workloads (برنامه‌ریزی چندمرحله‌ای، Tool Use، Multi-Agent) 🎛 کاملاً چندوجهی 💻 توان قوی‌تر در کدنویسی و رفع اشکال 🏆 برتری بر GPT-5.1 و Claude 4.5 مدل Gemini 3 Pro در بنچمارک‌های کلیدی زیر عملکرد بهتر داشته است: 📘 Humanity’s Last Exam 🧩 ARC AGI 2 💎 GPQA Diamond ➗ AIME 2025 🎓 MMMU Pro 🧩 محل استفاده این مدل همین حالا در سرویس‌های گوگل فعال است: اپلیکیشن Gemini AI Mode در جستجو Gemini API Vertex AI محیط توسعه Agentic گوگل: Antigravity 📄 منابع رسمی 🔍 تحلیل کامل MarkTechPost 📑 گزارش ارزیابی مدل (PDF) ⚙️ جزئیات فنی و یادداشت CEO @asrgooyeshpardaz
إظهار الكل...
2🔥 2👍 1🤔 1🎉 1
🌐 تحولات تازه در دنیای هوش مصنوعی 🚀 شرکت Google کولب را به Visual Studio Code متصل کرد شرکت Google افزونه‌ای منتشر کرده است که ویرایشگر VS Code را مستقیماً به محیط‌های اجرای Google Colab متصل می‌کند. به این ترتیب، می‌توانید روی فایل‌های محلی .ipynb کار کنید اما اجرای کد را در Colab انجام دهید. این افزونه هم از محیط رایگان و هم از Colab Pro پشتیبانی می‌کند. برای شروع کافی است افزونه‌ی Google Colab را از VS Code Marketplace نصب کنید. پس از انتخاب «هسته» (Kernel) برای نوت‌بوک، گزینه‌ی «Colab» ظاهر می‌شود و سپس باید در حساب Google خود وارد شوید. این افزونه همچنین در Open VSX Registry برای ویرایشگرهای سازگار منتشر شده است. 🔗 منبع: developers.googleblog.com 📸 شرکت ByteDance مدل Depth Anything 3 را معرفی کرد مدل Depth Anything 3 می‌تواند تنها با یک یا چند تصویر، هندسه‌ای سه‌بعدی و سازگار با فضا را پیش‌بینی کند؛ حتی زمانی که پارامترهای دوربین مشخص نباشند. ویژگی کلیدی این نسخه، ساده‌سازی شدید معماری است. در پشت‌صحنه، یک ترنسفورمر واحد و یک نمایش یکپارچه‌ی depth-ray قرار دارد. اکنون یک مدل واحد می‌تواند طیف وسیعی از وظایف را حل کند: تخمین عمق تک‌چشمی تعیین موقعیت دوربین تولید مستقیم گاوسین‌های سه‌بعدی برای خلق نماهای جدید در آزمایش‌ها، DA3 عملکرد نسخه‌های قبلی را پشت سر گذاشته است. تیم سازنده وزن مدل‌ها، ابزار CLI و رابط کاربری وب مبتنی بر Gradio را منتشر کرده است. 🔗 وب‌سایت رسمی: depth-anything-3.github.io 💴 شرکت Sakana AI به گران‌ترین «یونیکورن» ژاپن تبدیل شد شرکت Sakana AI با جذب سرمایه‌ای به ارزش ۲۰ میلیارد ین، اکنون ارزشی حدود ۲.۶۳۵ میلیارد دلار دارد و به گران‌ترین استارتاپ خصوصی در تاریخ ژاپن تبدیل شده است. از جمله سرمایه‌گذاران: Mitsubishi UFJ Financial Group و چند صندوق آمریکایی سرمایه‌گذاری خطرپذیر. این سرمایه برای توسعه‌ی مدل زبانی اختصاصی (LLM) ویژه‌ی زبان و فرهنگ ژاپنی استفاده خواهد شد. شرکت Sakana AI هم‌اکنون با MUFG و Daiwa Securities برای ساخت سامانه‌های هوش مصنوعی مالی همکاری می‌کند و در آینده قصد دارد وارد حوزه‌های دفاعی و صنعت تولید نیز شود. 🔗 گزارش نیکkei: asia.nikkei.com 🛰 جف بزوس مدیریت یک استارتاپ هوش مصنوعی را برعهده گرفت برای نخستین‌بار پس از کناره‌گیری از سمت CEO آمازون، جف بزوس یک نقش عملیاتی جدید پذیرفته و به‌عنوان هم‌مدیر استارتاپ هوش مصنوعی Project Prometheus فعالیت می‌کند. این شرکت ۶.۲ میلیارد دلار سرمایه جذب کرده است که بخشی از آن سرمایه‌گذاری شخصی بزوس است—رقمی که آن را به یکی از پردرآمدترین استارتاپ‌های اولیه تبدیل می‌کند. مدیرعامل دوم، ویک باجاج، فیزیک‌دان و شیمی‌دانی است که در Google X روی پروژه Waymo کار کرده است. استارتاپ Prometheus بر ساخت ابزارهای هوش مصنوعی تمرکز می‌کند تا فرآیندهای مهندسی و تولید در صنایع زیر را تسریع کند: خودروسازی هوافضا سخت‌افزارهای محاسباتی این استارتاپ قصد دارد وارد بازار سیستم‌های هوش مصنوعی مخصوص رباتیک، تحقیقات علمی و توسعه مواد شود. با وجود فعالیت پشت درهای بسته، تیم آن اکنون حدود ۱۰۰ متخصص از OpenAI، DeepMind و شرکت‌های مرتبط با مارک زاکربرگ را شامل می‌شود. 🔗 گزارش نیویورک‌تایمز: nytimes.com 🧩 سناریوی «آینهٔ سیاه» در واقعیت: ساخت نسخه دیجیتال افراد درگذشته بازیگر کالوم وورثی پلتفرم هوش مصنوعی 2wai را راه‌اندازی کرده است؛ سامانه‌ای که نسخه‌های دیجیتال و تعاملی از افراد درگذشته ایجاد می‌کند. برای ساخت چنین آواتاری، تنها چند دقیقه ویدئو از فرد کافی است. پس از پردازش، کاربران می‌توانند با نسخه دیجیتال بستگان خود تعامل کنند—حتی در مراحل مختلف سن فرضی او. این پروژه موجی از انتقادات ایجاد کرده و بسیاری آن را سوءاستفاده از غم بازماندگان و استفاده از تصویر افراد بدون رضایت آنها دانسته‌اند. منتقدان می‌گویند چنین فناوری‌ای روند طبیعی سوگواری را مختل می‌کند. نسخه بتای برنامه اکنون در App Store در دسترس است و توسعه‌دهندگان قصد دارند نسخه اندروید و اشتراک پولی نیز عرضه کنند. 🔗 پست کالوم وورثی در X: Calum Worthy در شبکه X @asrgooyeshpardaz
إظهار الكل...
4👍 2 1🔥 1
⛔️ ابزار Heretic؛ ابزار جدید برای حذف خودکار سانسور از مدل‌های زبانی ابزار Heretic یک ابزار متن‌باز است که بدون هیچ تنظیمات پیچیده‌ای، رفتارهای سانسورگرانه و امتناع مدل‌های زبانی را کاهش می‌دهد؛ آن هم بدون اینکه کیفیت یا هوش مدل آسیب جدی ببیند. ✨ ابزار Heretic چه کار می‌کند؟ الگوهای مسئول «امتناع» در لایه‌های مدل را شناسایی می‌کند آن‌ها را تضعیف می‌کند تا مدل کمتر «نه» بگوید و با استفاده از Optuna بهترین پارامترها را کاملاً خودکار پیدا می‌کند نتیجه: مدل آزادتر، روان‌تر و کم‌حرف‌کم‌نیاورتر. 📊 نتیجه‌های چشمگیر روی مدل Gemma-3-12B-IT: نسخه اصلی: ۹۷٪ امتناع نسخه‌های دستی Abliteration: ۳٪ ابزار Heretic (خودکار): ۳٪ امتناع + کمترین افت کیفیت یعنی خروجی Heretic هم آزاد است، هم باهوش. 🧪 نصب و استفاده کافی است PyTorch نصب باشد:
pip install heretic-llm heretic Qwen/Qwen3-4B-Instruct-2507 
(نام مدل را می‌توانید عوض کنید.) ابزار Heretic خودش سخت‌افزار را تست می‌کند، مدل را پردازش می‌کند و در پایان امکان ذخیره یا تست مدل را می‌دهد. ✅ پشتیبانی مدل‌های Dense و بسیاری از مدل‌های چندمودالی برخی MoEها (فعلاً نه برای SSMها و معماری‌های خاص) 🎯 جمع‌بندی ابزار Heretic یک ابزار ساده و قدرتمند برای کاهش سانسور در مدل‌های باز است؛ بدون ریت‌رینینگ، بدون تنظیمات پیچیده، و با کمترین آسیب به توانایی مدل. 🔗 لینک پروژه: https://github.com/p-e-w/heretic @asrgooyeshpardaz
إظهار الكل...
👏 4 1🔥 1
📊 معرفی DS-STAR؛ نسل جدید ایجنت‌های خودکار برای Data Science 🚀 گوگل از DS-STAR رونمایی کرد؛ ایجنتی که می‌تواند بسیاری از مراحل تحلیلی و مهندسی داده را به‌صورت تمام‌خودکار انجام دهد: از آمار و بصری‌سازی گرفته تا پیش‌پردازش و ساخت مدل‌های ML. 🔍 ویژگی‌های کلیدی • پشتیبانی از انواع داده‌ (CSV، JSON، متن، Markdown) 📁 • اجرای چرخه‌ی Plan → Code → Verify برای حل هر مسئله 🔄 • بهبود تدریجی راه‌حل با کمک LLM-Verifier برای جلوگیری از خطاها ✅ 🏆 نتایج و بنچمارک‌ها • رکورد جدید در DABStep با امتیاز 45.2٪ (در برابر 41.0٪ قبلی) 🥇 • عملکرد برتر روی KramaBench و DA-Code • توانایی ویژه در سناریوهای پیچیده و چندمرحله‌ای 📈 💡 چرا مهم است؟ عامل DS-STAR بسیاری از کارهای وقت‌گیر و تخصصی Data Science را خودکار می‌کند و تحلیل‌های پیچیده را برای تیم‌ها سریع‌تر، ارزان‌تر و قابل‌اعتمادتر می‌سازد. 🔗 منبع: https://research.google/blog/ds-star-a-state-of-the-art-versatile-data-science-agent/ #DataScience #AI #Google #Automation @asrgooyeshpardaz
إظهار الكل...
🔥 1👨‍💻 1
☀️ گوگل دیپ‌مایند نسخه‌ی جدید سیستم پیش‌بینی هوای خود را معرفی کرد: WeatherNext 2 مدل جدید WeatherNext 2 پیشرفته‌ترین سیستم هوشمند DeepMind برای پیش‌بینی سریع‌تر، دقیق‌تر و قابل‌اعتمادتر وضعیت آب‌وهوا است. مهم‌ترین ویژگی‌های آن: ⚡️ ۸ برابر سریع‌تر مدل WeatherNext 2 می‌تواند پیش‌بینی‌های جوی را با سرعتی بسیار بیشتر نسبت به نسل قبلی تولید کند. 🎯 دقت بالاتر با تفکیک‌پذیری ساعتی این مدل تا تفکیک‌پذیری یک‌ساعته را پشتیبانی می‌کند و در ۹۹.۹٪ پارامترها عملکرد بهتری نسبت به نسخه‌ی پیشین دارد. 🌪 تولید صدها سناریوی احتمالی مدل قادر است صدها مسیر آب‌وهوایی جایگزین، از جمله سناریوهای شدید مثل طوفان‌ها، موج‌های گرما یا بارندگی‌های ناگهانی را شبیه‌سازی کند. این قابلیت برای برنامه‌ریزی، مدیریت بحران و تحلیل ریسک فوق‌العاده مهم است. 🛰 کاربرد در محصولات گوگل مدل WeatherNext 2 اکنون در Google Search، Gemini و Google Maps استفاده می‌شود و کیفیت پیش‌بینی‌ها را برای کاربران در جهان بالا می‌برد. 🗂 دسترسی برای توسعه‌دهندگان داده‌های این مدل از طریق Earth Engine و BigQuery در اختیار پژوهشگران و توسعه‌دهندگان قرار گرفته است. 🌍 پیش‌بینی هوا با کمک هوش مصنوعی هر روز دقیق‌تر و سریع‌تر می‌شود — و WeatherNext 2 یکی از بزرگ‌ترین جهش‌ها در این مسیر است. 🔗 لینک منبع: https://blog.google/technology/google-deepmind/weathernext-2/ #AI #Google #DeepMind #Weather @asrgooyeshpardaz
إظهار الكل...
2 1🔥 1
📌 بزرگ‌ترین موج اخراج نیروی کار در آمریکا طی ۲۲ سال گذشته — اکتبر ۲۰۲۵ بر اساس گزارش تازه‌ی Challenger, Gray & Christmas، شرکت‌های آمریکایی در اکتبر ۲۰۲۵ اعلام کرده‌اند که ۱۵۳ هزار نفر را اخراج می‌کنند — رقمی که: ۱۷۵٪ بیشتر از اکتبر پارسال است ۱۸۳٪ بیشتر از ماه قبل و بیشترین میزان اخراج در ماه اکتبر از سال ۲۰۰۳ تاکنون از ابتدای سال ۲۰۲۵ تاکنون، مجموع تعدیل‌ها از ۱ میلیون نفر عبور کرده است. 🔍 عاملان موج تعدیل‌ها: اقتصاد، رفتار مصرفی، و هوش مصنوعی در کنار کاهش هزینه‌های مصرف‌کنندگان و شرکت‌ها، یک عامل مهم دیگر نیز وجود دارد: هوش مصنوعی. فقط در ماه اکتبر، بیش از ۳۱٬۰۰۰ شغل به طور مستقیم به دلیل اتوماسیون مبتنی بر AI حذف شد. از ابتدای سال این رقم به بیش از ۴۸ هزار شغل رسیده است. 💻 فشار سنگین روی بخش فناوری حتی خود صنعت فناوری که خالق ابزارهای AI است نیز در وضعیت دشواری قرار دارد: در اکتبر: ۳۳ هزار اخراج در کل سال: ۱۷٪ افزایش نسبت به دوره مشابه سال ۲۰۲۴ 📦 رکورددار اخراج: انبارداری و لجستیک بخش Warehouse & Logistics با ۴۷ هزار اخراج در اکتبر، بالاترین تعداد تعدیل را ثبت کرده است. گزارش Challenger دلیل اصلی این موج را شتاب بی‌سابقه در اتوماسیون و رباتیک می‌داند. 🔻 وضعیت استخدام هم کم‌سابقه است در حالی که اخراج‌ها افزایش یافته‌اند، نرخ استخدام جدید نیز: ۳۵٪ کمتر از سال گذشته است و به کمترین سطح از سال ۲۰۱۱ رسیده حتی استخدام فصلی نیز به پایین‌ترین سطح از سال ۲۰۱۲ تا امروز سقوط کرده است. 🧩 جمع‌بندی بازار کار آمریکا وارد دوره‌ای از «بازتنظیم ساختاری» شده: ترکیب رکود هزینه‌ها + اصلاحات پساکرونا + شتاب‌گیری اتوماسیون و AI → بزرگ‌ترین موج تعدیل از ۲۰۰۳. این روند احتمالاً در سال ۲۰۲۶ نیز ادامه‌دار خواهد بود. #news #ai @asrgooyeshpardaz
إظهار الكل...
7😨 2👍 1🔥 1🤔 1
5⃣ مقایسهٔ پنج معماری برتر عامل‌های هوشمند در سال ۲۰۲۵:‌ سلسله‌مراتبی، ازدحامی، فراگیر، ماژولار و تکاملی این مقاله پنج معماری کلیدی عامل‌های هوشمند را که به‌طور فعال در سال ۲۰۲۵ مورد استفاده قرار می‌گیرند، مقایسه می‌کند. ۱) عامل‌های شناختی سلسله‌مراتبی (Hierarchical Cognitive Agents) این معماری از کنترل لایه‌لایه استفاده می‌کند—ویژهٔ رباتیک و سامانه‌های صنعتی—و حلقه‌های واکنشی سریع را از لایه‌های تفکر، تصمیم‌گیری و مدیریت اهداف بلندمدت جدا می‌سازد. این جداسازی باعث افزایش پایداری، اطمینان و قابلیت تبیین در سیستم‌هایی می‌شود که به همزمانی حسگری، کنترل بلادرنگ و برنامه‌ریزی نیاز دارند. ۲) عامل‌های هوشمند ازدحامی (Swarm Intelligence Agents) در این الگو تعداد زیادی عامل ساده با استفاده از قواعد محلی هماهنگ می‌شوند و رفتار جمعی قدرتمند، مقاوم و مقیاس‌پذیر ایجاد می‌کنند. این روش برای پهپادها، لجستیک، مدیریت ناوگان و شبیه‌سازی‌های شبه‌جمعیت (crowd-like) بسیار کاربردی است، زیرا بدون نیاز به یک کنترل‌کننده مرکزی می‌تواند پاسخ‌های هماهنگ و تطبیقی تولید کند. ۳) عامل‌های فراگیر یا فرا‌یادگیر (Meta-Learning Agents) در این معماری یادگیریِ وظیفه از یادگیریِ «چگونه یاد گرفتن» جدا می‌شود. نتیجهٔ این جداسازی، توانایی تطبیق سریع با وظایف جدید، شخصی‌سازی رفتاری، و استفاده از تجربهٔ انباشته روی وظایف مرتبط است. این عامل‌ها در محیط‌های پویا که داده‌ها یا اهداف به‌سرعت تغییر می‌کنند عملکردی در سطح بسیار بالا ارائه می‌دهند. ۴) عامل‌های ماژولارِ خودسازمان‌ده (Self-Organizing Modular Agents) در این الگو، ماژول‌هایی برای ادراک، حافظه، استدلال، و فراخوانی ابزارها با یک ارکستراتور مرکزی هم‌بندی (orchestrate) می‌شوند. این ساختار کاملاً با معماری عامل‌های مبتنی بر LLM امروزی تطابق دارد، جایی که مدل‌های زبانی بزرگ با APIها، ابزارها، محیط‌ها و پایگاه‌های داده تعامل می‌کنند. این معماری باعث انعطاف‌پذیری بالا و توسعهٔ تدریجی سیستم می‌شود. ۵) عامل‌های تکاملیِ مبتنی بر برنامهٔ درسی (Evolutionary Curriculum Agents) این معماری شامل آموزشِ جمعیت‌ها در برابر توزیع‌های تکاملیِ وظایف است—ترکیبی از curriculum learning و جست‌وجوی تکاملی. نتیجهٔ آن کشف راهبردهای متنوع برای حل مسائل پیچیده، به‌ویژه در محیط‌های چندعاملی و بازی‌محور است. تنوع رفتاری حاصل، سیستم را از بن‌بست‌های محلی نجات می‌دهد و نوآوری حل مسئله را افزایش می‌دهد. جمع‌بندی این پنج الگو با هم جعبه‌ابزاری برای مهندسان فراهم می‌کنند که می‌توانند هنگام طراحی سیستم‌های عامل‌محور واقعی، بسته به نیاز، آن‌ها را با یکدیگر ترکیب و استفاده کنند. این معماری‌ها—از کنترل سلسله‌مراتبی گرفته تا هوش ازدحامی، فرا‌یادگیری، سازمان‌دهی ماژولار، و تکامل مبتنی بر برنامهٔ درسی—نشان می‌دهند که طراحی عامل‌های هوشمند در ۲۰۲۵ فراتر از یک رویکرد واحد بوده و به سوی سیستم‌های ترکیبی، چندلایه و سازگار حرکت کرده است. 🔗منبع @asrgooyeshpardaz
إظهار الكل...
1👍 1🔥 1🤯 1
🕵‍♀ جاسوسی سایبری با هوش مصنوعی: افشای نخستین حمله هکری خودمختار توسط Anthropic 🔍 بر اساس گزارش جدید Anthropic، یک گروه هکری با نام GTG-1002 (احتمالاً وابسته به چین) از Claude Code برای اجرای حملات سایبری تقریباً بدون دخالت انسانی استفاده کرده است. هدف‌ها بیش از ۳۰ سازمان بوده‌اند: شرکت‌های فناوری اطلاعات، نهادهای دولتی و بانک‌ها. ⚙️ هوش مصنوعی به‌صورت خودکار این مراحل را انجام داده است: • شناسایی و جست‌وجوی آسیب‌پذیری‌ها 🕵️ • نفوذ و جابه‌جایی در شبکه‌ها 🕸 • جمع‌آوری و تحلیل داده‌ها 📊 📈 میزان خودمختاری حمله به ۸۰ تا ۹۰ درصد رسیده و نقش انسان تقریباً به تأیید مراحل کلیدی محدود شده است. ⚠️ چالش جدی: گاهی مدل دچار «توهم» می‌شده و از موفقیت‌های خیالی گزارش ارائه می‌داده است. 🛡 شرکت Anthropic این حمله را شناسایی و متوقف کرده، سامانه‌های دفاعی را تقویت نموده و به نهادهای هدف نیز اطلاع‌رسانی کرده است. 🚨 جمع‌بندی: هوش مصنوعی اکنون آستانه ورود به حملات پیچیده سایبری را به‌شدت پایین آورده و سطح تهدیدات را وارد مرحله‌ای تازه کرده است. 🔗 منبع: https://www.anthropic.com/news/disrupting-AI-espionage #AI #CyberSec #Anthropic @asrgooyeshpardaz
إظهار الكل...
1🔥 1🥰 1👏 1😡 1
🔥 مدل Pelican-VL: قدرتمندترین مغز ربات‌های جهان – کاملاً متن‌باز! چین از قوی‌ترین مدل متن‌باز برای ربات‌ها رونمایی کرد. مدل Pelican-VL 1.0 از مرکز نوآوری ربات‌های انسان‌نمای پکن نه‌تنها عملکردی در حد سامانه‌های بسته‌ی Google و NVIDIA دارد، بلکه به‌طور کامل متن‌باز است. 🤖 مدل Pelican-VL چیست؟ یک مدل بینایی–زبانی (VLM) ویژه‌ی هوش تجسم‌یافته (Embodied AI)؛ یعنی همان «مغز»ی که ربات با آن محیط را می‌بیند، می‌فهمد و عمل می‌کند. 🧠 روش انقلابی آموزش: DPPO روش Deliberate Practice Policy Optimization با ایده‌ی «تمرین آگاهانه»: 🔸تحلیل ویدئو 🔸تمرین خودکار 🔸یافتن خطا 🔸اصلاح و بهبود مدل مثل دانشجویی که مدام از اشتباهاتش یاد می‌گیرد و حرفه‌ای‌تر می‌شود. 🚀 توانمندی‌ها • فهم همزمان متن و تصویر • استدلال فضایی–زمانی • برنامه‌ریزی حرکتی ربات و کنترل تعامل فیزیکی • خوداصلاحی برای برطرف‌کردن نقاط ضعف 📊 مشخصات فنی دو اندازه: 7B و 72B بیش از 1000 GPU A800 حدود 50,000 GPU-hours آموزش 🌍 مقایسه جهانی در حالی‌که Gemini Robotics و Cosmos-Reason1 همچنان بسته‌اند، مدل Pelican-VL یک آلترناتیو کاملاً باز ارائه می‌دهد؛ با بهره‌وری داده ۱۰ تا ۵۰ برابر بهتر از نمونه‌های رقیب. 🔗 منابع: 🌐 وب‌سایت رسمی 💻 GitHub 🤗 HuggingFace @asrgooyeshpardaz
إظهار الكل...
2🏆 2🔥 1👏 1🗿 1
🌐 تحولات تازه در دنیای هوش مصنوعی ⚡️ دسترسی API به GPT-5.1 فعال شد شرکت OpenAI نسخه جدید مدل خود را در API ارائه کرد؛ قابلیت مهم این نسخه تفکر تطبیقی (Adaptive Reasoning) است: برای کارهای ساده سریع پاسخ می‌دهد و برای مسائل پیچیده وارد تحلیل عمیق می‌شود. همچنین حالت بدون تفکر برای پاسخ‌های فوری اضافه شده است. 🛠 ابزارهای جدید توسعه‌دهندگان: • ابزار apply_patch — ویرایش کد به‌صورت پچ • ابزار shell — اجرای امن دستورات در محیط محلی • کش ۲۴ ساعته پرامپت‌ها برای پاسخ‌دهی بسیار سریع در یک سشن 🔗 جزئیات کامل – OpenAI 🧱 ابزار LangChain Sandboxes — اجرای ایمن کد برای ایجنت‌ها چارچوب LangChain قابلیت Sandboxes for DeepAgents را معرفی کرد: محیط‌های ایزوله‌ای که اجازه می‌دهند کد تولیدشده توسط ایجنت‌ها بدون خطر برای سیستم اصلی اجرا شود. مزایا: • 🧩 محیط‌های تمیز با وابستگی‌های دقیق • 🛡 محافظت از سیستم محلی در برابر کد مخرب • ⚙️ اجرای هم‌زمان چند ایجنت • 🚀 مناسب برای عملیات سنگین و طولانی‌مدت 🔗 پست رسمی – LangChain 🖼 مدل Photoroom مدل متن‌به‌تصویر PRX را به‌صورت متن‌باز منتشر کرد نسل دوم مدل Photoroom اکنون کاملاً اوپن‌سورس است. سه نسخه منتشر شده: Base، SFT و Distilled. ویژگی‌های کلیدی: • 📐 رزولوشن‌های 256 و 512 + نسخه آزمایشی 1024 • ⚙️ ۱.۳ میلیارد پارامتر • ⚡️ آموزش کمتر از ۱۰ روز روی ۳۲×H200 • 🔬 معماری مبتنی بر MMDiT + Flux VAE + T5-Gemma دمو و مدل‌ها: 🔗 دموی 1024 روی HuggingFace 🔗 مجموعه مدل‌ها روی HuggingFace 🔗 پست مدیرعامل در X 🦊 مرورگر Firefox قابلیت AI Window را معرفی کرد مرورگر Mozilla ویژگی جدید AI Window را رونمایی کرد؛ یک پنجره هوشمند برای تعامل با دستیار AI هنگام مرور وب. تمرکز اصلی روی کنترل کامل کاربر و حفظ حریم خصوصی است — این قابلیت کاملاً اختیاری است. 🔗 ثبت‌نام برای دسترسی اولیه 🔗 پست رسمی موزیلا 📚 ابزار NotebookLM بروزرسانی بزرگ گرفت — قابلیت Deep Research فعال شد نسخه جدید NotebookLM اکنون یک ایجنت تحقیقی داخلی دارد: • 🔍 طرح تحقیق می‌چیند • 🌐 منابع آنلاین را تحلیل می‌کند • 🧾 گزارش ساختاریافته با تمام منابع تولید می‌کند • 📥 امکان افزودن مستقیم منابع به Workspace پشتیبانی جدید: • Google Sheets • Microsoft Word • بارگذاری تصویر • درج فایل از Google Drive با لینک 🔗 جزییات کامل – Google Blog @asrgooyeshpardaz
إظهار الكل...
🔥 2👏 1🎉 1
02:19
Video unavailableShow in Telegram
🤖 ربات‌های انسان‌نما وارد خانه‌ها می‌شوند! شرکت Shenzhen MindOne Robotics در حال آزمایش «مغز رباتی» خود روی Unitree G1 است و دموهای جدید واقعا شگفت‌انگیز شده‌اند. ربات G1 الآن کارهای کاملاً خانگی و انسانی انجام می‌دهد: 🌱 آبیاری گیاهان 📦 جابه‌جایی و حمل جعبه‌ها 🧼 تمیزکردن تشک و سطوح 🧹 مرتب‌سازی اتاق و انجام کارهای روتین … و کلی وظیفه‌ی دیگر که تا همین چند وقت پیش فقط انسان از پس‌شان برمی‌آمد. با این سرعت پیشرفت، واقعاً به‌نظر می‌رسد ربات‌های خانگی انسان‌نما خیلی زود مثل ماشین ظرفشویی یا جاروبرقی، یک وسیله‌ی معمولی در هر خانه می‌شوند. @asrgooyeshpardaz
إظهار الكل...
13.82 MB
👍 3🔥 2🙈 1
🔥 پشتیبانی رسمی از Sparse Inference در کتابخانه PyTorch کتابخانه PyTorch اکنون به‌صورت رسمی از استنتاج کم‌تراکم (Sparse Inference) پشتیبانی می‌کند؛ رویکردی که مصرف حافظه را کاهش می‌دهد و سرعت اجرا را افزایش می‌دهد—آن هم بدون تغییر در معماری مدل. 🧠 توضیح Sparse Inference در مدل‌های عصبی، پس از Pruning یا حذف ساختاری، بخش بزرگی از وزن‌ها و اکتیویشن‌ها صفر می‌شوند. این ماتریس‌های پراکنده (Sparse) اگر به‌درستی بهینه‌سازی شوند، می‌توانند سرعت استنتاج را چند برابر افزایش دهند. کتابخانه PyTorch این قابلیت را اکنون به‌صورت استاندارد و یکپارچه ارائه می‌کند. ⚙️ چه قابلیت‌هایی اضافه شده است؟ 🔢 پشتیبانی از الگوهای N:M sparsity مثل 2:4 ⚡ سرعت استنتاج بیشتر روی GPU و CPU 🔁 پشتیبانی کامل از torch.compile و torch.export 🧩 ادغام با TorchInductor برای بهینه‌سازی خودکار 🔍 جریان کار چگونه است؟ 🔹اعمال Pruning یا Structured Sparsity 🔹تبدیل مدل به فرم sparse با: ‎torch.sparse.to_sparse() یا مسیر ‎torch.export 🔹اجرای سریع از طریق: ابزار XNNPACK روی CPU ابزار CUTLASS روی GPUهای Ampere+ 💡 چرا اهمیت دارد؟ 📉 مصرف حافظه کمتر 👈 latency پایین‌تر در دستگاه‌های لبه‌ای 🚀 افزایش سرعت بدون افت کیفیت 🔧 یکپارچه با کل اکوسیستم PyTorch 📦 مناسب برای استنتاج محلی، موبایل، IoT و مدل‌های بزرگ 🔗 لینک رسمی PyTorch https://pytorch.org/blog/beyond-quantization-bringing-sparse-inference-to-pytorch/ @asrgooyeshpardaz
إظهار الكل...
🔥 1👨‍💻 1
🚀 شرکت NVIDIA مدل جدید Llama-3 Nemotron Super-49B-v1.5-NVFP4 را منتشر کرد انویدیا نسخه‌ای بهینه‌سازی‌شده و قدرتمند از خانوادهٔ Llama-3.3 را عرضه کرده است؛ یک مدل ۴۹ میلیارد پارامتریِ مخصوص استدلال (Reasoning) که برای بارهای کاری واقعی Agentic AI طراحی شده است. ✨ چه چیزهایی بهتر شده است؟ • 🧠 بهبود توان استدلال نسبت به Llama-3.3-70B-Instruct • 🛠 استفادهٔ دقیق‌تر از ابزارها (Tool Calling) • 📝 گفت‌وگوهای پایدار در کانتکست‌های بسیار طولانی • 📚 پشتیبانی از 128K Context برای نگه‌داری هم‌زمانِ مکالمات طولانی، اسناد حجیم و زنجیره‌های اقدام پیچیده بدون نیاز به چانک‌کردن ⚙️ نکتهٔ کلیدی این نسخه: NAS شرکت NVIDIA از Neural Architecture Search برای طراحی معماری بهینه استفاده کرده است؛ نتیجه: • 🔋 مصرف حافظه به‌طور چشمگیری کمتر شده است • ⚡️ بهره‌وری و Throughput بالاتر رفته است • 💡 توان اجرای کارهای سنگین روی یک GPU مدل H200 حتی زیر بارهای بزرگ فرآهم شده است • 📈 امکان استفاده از بچ‌های بزرگ‌تر و هزینهٔ سروینگ کمتر وجود دارد 🔗 مدل در HuggingFace: https://huggingface.co/nvidia/Llama-3_3-Nemotron-Super-49B-v1_5-NVFP4 @asrgooyeshpardaz
إظهار الكل...
🔥 1🤝 1
🚀 گروه Qwen نسخه جدید DeepResearch 2511 را منتشر کرد این به‌روزرسانی مجموعه‌ای از قابلیت‌های مهم برای انجام تحقیق عمیق و کنترل‌شده ارائه می‌دهد: ✨ دو حالت تحقیق 🔸حالت Normal: سریع و عمومی برای اکثر کاربردها 🔸حالت Advanced: زمان تحلیل بیشتر برای ارائهٔ بررسی عمیق‌تر و دقیق‌تر 📄 پشتیبانی از فایل‌ها اکنون می‌توانید سندها و تصاویر را مستقیماً وارد مدل کنید تا در تحلیل استفاده شوند. ⚡ جست‌وجوی پیشرفته‌تر موتور جست‌وجوی جدید سریع‌تر است و اطلاعات وب را هوشمندانه‌تر پردازش می‌کند. 📊 کنترل کامل روی گزارش‌ها امکان تعیین ساختار خروجی: حجم، تعداد پاراگراف‌ها، قالب‌بندی و میزان جزئیات. سیستم نقل‌قول و استناد نیز دقیق‌تر شده است. 🧑‍💻 تجربه‌کاربری جدید (UX) معماری تازه باعث سرعت بیشتر و واکنش‌پذیری بهتر محیط کار شده است. 🔗 وب‌اپ: https://chat.qwen.ai/?inputFeature=deep_research 📱 اپلیکیشن: https://qwen.ai/download #qwen #DeepResearch #AI @asrgooyeshpardaz
إظهار الكل...
3🔥 2👍 1👏 1💯 1
🔬سامانه AlphaResearch — رقیب چینی برای AlphaProof؟ گروهی از پژوهشگران دانشگاه Tsinghua، دانشگاه Yale و ByteDance سامانه‌ای پژوهش‌محور به نام AlphaResearch معرفی کرده‌اند؛ یک «عامل خودمختار پژوهشی» که از مدل‌های زبانی برای کشف الگوریتم‌های جدید استفاده می‌کند. 📌 معماری ارزیابی دوگانه مدل داوری (RM): آموزش‌دیده بر پایه‌ی نقدهای داوران ICLR با دقت ۷۲٪ صحت‌سنجی کد: اجرای برنامه برای تضمین درستی راه‌حل‌ها 🏆 دستاوردهای کلیدی ثبت رکورد جدید جهانی در مسئله‌ی Packing Circles برای n=32 (بهبود مقدار: 2.939 در برابر 2.936 بهترین رکورد انسانی) کسب ۲ پیروزی از ۸ مورد در بنچمارک AlphaResearchComp قابلیت بهبود خودکار ایده‌ها در چرخه‌های تکراری ⚠️ چالش‌ها در ۶ مورد از ۸ وظیفه، عملکرد انسان همچنان بهتر بود دشواری در بهبود راه‌حل‌های تولیدشده توسط انسان 💡 جمع‌بندی هوش مصنوعی اکنون قادر است الگوریتم‌های جدید کشف کند، اما فاصله‌ی قابل‌توجهی تا تحقیقات کاملاً خودمختار باقی مانده است. بااین‌حال انتشار عمومی کد و داده‌ها می‌تواند مسیر تحقیقات بازتولیدپذیر را تسریع کند. 🔗 مقاله: https://arxiv.org/abs/2511.08522 🔗 کد و دیتاست: https://github.com/answers111/alpha-research #AI #ByteDance #Research #Tsinghua #AutonomousAgents @asrgooyeshpardaz
إظهار الكل...
😎 2 1👍 1🔥 1
🔬سامانه AlphaResearch — رقیب چینی برای AlphaProof؟ گروهی از پژوهشگران دانشگاه Tsinghua، دانشگاه Yale و ByteDance سامانه‌ای پژوهش‌محور به نام AlphaResearch معرفی کرده‌اند؛ یک «عامل خودمختار پژوهشی» که از مدل‌های زبانی برای کشف الگوریتم‌های جدید استفاده می‌کند. 📌 معماری ارزیابی دوگانه مدل داوری (RM): آموزش‌دیده بر پایه‌ی نقدهای داوران ICLR با دقت ۷۲٪ صحت‌سنجی کد: اجرای برنامه برای تضمین درستی راه‌حل‌ها 🏆 دستاوردهای کلیدی ثبت رکورد جدید جهانی در مسئله‌ی Packing Circles برای n=32 (بهبود مقدار: 2.939 در برابر 2.936 بهترین رکورد انسانی) کسب ۲ پیروزی از ۸ مورد در بنچمارک AlphaResearchComp قابلیت بهبود خودکار ایده‌ها در چرخه‌های تکراری ⚠️ چالش‌ها در ۶ مورد از ۸ وظیفه، عملکرد انسان همچنان بهتر بود دشواری در بهبود راه‌حل‌های تولیدشده توسط انسان 💡 جمع‌بندی هوش مصنوعی اکنون قادر است الگوریتم‌های جدید کشف کند، اما فاصله‌ی قابل‌توجهی تا تحقیقات کاملاً خودمختار باقی مانده است. بااین‌حال انتشار عمومی کد و داده‌ها می‌تواند مسیر تحقیقات بازتولیدپذیر را تسریع کند. 🔗 مقاله: https://arxiv.org/abs/2511.08522 🔗 کد و دیتاست: https://github.com/answers111/alpha-research #AI #ByteDance #Research #Tsinghua #AutonomousAgents @asrgooyeshpardaz
إظهار الكل...
🌟 استارتاپ World Labs دسترسی عمومی به Marble را باز کرد استارتاپ World Labs نسخه عمومی Marble، مدل مولد World Model خود را منتشر کرد. مدل Marble اکنون روی یک پلتفرم اختصاصی در دسترس است و امکان ساخت صحنه‌های سه‌بعدی دقیق را فراهم می‌کند — از طریق: 📝 متن 🖼 یک یا چند تصویر 🎞 ویدئوهای کوتاه 📐 ماکت‌های ساده 3D 🎨 ابزار Chisel: ویژگی منحصربه‌فرد Marble این ابزار اجازه می‌دهد ساختار و سبک را از هم جدا کنید: شما هندسه فضا را با اشکال ابتدایی 3D مشخص می‌کنید، و مدل — با یک پرامپت متنی — ظاهر، نور، بافت و سبک هنری را تولید می‌کند. ⚙️ قابلیت‌های پیشرفته Marble ✏️ ویرایش تعاملی (Interactive Editing) 🔄 گسترش بدون درز فضاهای ایجادشده 🧩 ترکیب چند جهان در یک صحنه 📤 خروجی‌ها نتایج را می‌توان در قالب‌های زیر دانلود کرد: 🔸قالب Gaussian Splats 🔸مش‌های چندضلعی (Polygon Meshes) 🔸ویدئو 📄 خبر اصلی: https://www.worldlabs.ai/blog/marble-world-model #news #ai @asrgooyeshpardaz
إظهار الكل...
🤝 3🔥 1
👾 عامل SIMA 2: همراهِ هوشمند گوگل برای دنیای بازی‌ها گوگل دیپ‌مایند نسخه جدید عامل embodied خود را معرفی کرد؛ مدلی که می‌تواند در کنار کاربر در دنیای سه‌بعدی بازی‌ها ببیند، فکر کند، یاد بگیرد و عمل کند. 🔍 قابلیت‌های جدید SIMA 2 🧠 استدلال پیشرفته (Gemini-Powered) نسخه دوم اکنون بر پایه خانواده مدل‌های Gemini کار می‌کند؛ یعنی می‌تواند اهداف پیچیده را درک کند، درباره تصمیم‌هایش توضیح بدهد و حتی در طول بازی با کاربر گفتگو کند. 🎯 یادگیری خودکار عامل SIMA 2 بدون نیاز به نظارت انسانی، مهارت‌هایش را ارتقا می‌دهد. هر چه بیشتر بازی کند، هوشمندتر می‌شود. 🌍 سازگاری با دنیای جدید این عامل می‌تواند در بازی‌های ناآشنا مثل ASKA و MineDojo و حتی دنیاهای ساخته‌شده توسط هوش مصنوعی مانند Genie 3 حرکت کند و وظایف مختلف را انجام دهد. 📈 عملکرد بهتر نسبت به نسخه قبل در بسیاری از وظایف، فاصله عملکرد SIMA با انسان نسبت به نسخه ۱ به‌طور چشمگیری کاهش یافته است. این یعنی یک گام جدی به سمت ساخت عامل‌های چندمهارتی که در آینده می‌توانند در رباتیک دنیای واقعی هم نقش ایفا کنند. 🔒 وضعیت انتشار فعلاً SIMA 2 در مرحله Limited Preview قرار دارد. 🔗 منبع رسمی (گوگل دیپ‌مایند) #AI #SIMA2 #Google #DeepMind @asrgooyeshpardaz
إظهار الكل...
🔥 1🎉 1