ru
Feedback
عصر گویش | هوش مصنوعی

عصر گویش | هوش مصنوعی

Открыть в Telegram

مجله هوش مصنوعی عصر گویش 021 61931000

Больше
2025 год в цифрахsnowflakes fon
card fon
111 619
Подписчики
-7724 часа
-7427 дней
-3 10330 день
Архив постов
⚡️ چارچوب Air — چارچوب تازه‌ی پایتونی با رویکرد «AI-First» چارچوب Air هنوز در مرحله‌ی آلفا قرار دارد، اما از همین حالا مشخص است که هدف آن فقط ساخت یک ابزار جدید برای توسعه‌ی وب نیست، بلکه بازاندیشی در نحوه‌ی طراحی وب‌اپلیکیشن‌ها در عصر هوش مصنوعی است. 🌟 ویژگی‌های متمایز Air 🔹سازگاری کامل با FastAPI / Starlette: مسیردهی، میان‌افزارها (middleware)، و پشتیبانی از OpenAPI از همان ابتدا در دسترس‌اند. 🔹یکپارچگی با پایگاه‌داده‌ها از طریق air.ext.sqlmodel (سازگار با SQLModel و SQLAlchemy). 🔹احراز هویت آماده‌ی استفاده: پشتیبانی از OAuth و ورود از طریق GitHub به‌صورت پیش‌فرض. 🔹رویکرد نو در ساخت رابط کاربری: استفاده از قالب‌ها و تگ‌های اعلامی (declarative tags) با الهام از HTMX، بدون نیاز به جاوااسکریپت سنگین و با واکنش‌پذیری بالا. 🔹سادگی در عین هوشمندی: ساختار و APIها ساده و شفاف‌اند، مشابه Django، اما از ابتدا برای تعامل با مدل‌های هوش مصنوعی طراحی شده‌اند. ⚠️ نکته‌ی مهم چارچوب Air هنوز یک آزمایش در حال تکامل است. APIها ممکن است تغییر کنند و برخی قابلیت‌ها هنوز کامل نشده باشند. توسعه‌دهندگان از جامعه‌ی برنامه‌نویسان دعوت می‌کنند تا در شکل‌گیری این فریم‌ورک آینده‌نگر مشارکت کنند. اگر از فریم‌ورک‌های معمول خسته شده‌اید و به دنبال ساخت وب‌سیستمی هستید که هوش مصنوعی در هسته‌ی معماری آن جای دارد، چارچوب Air می‌تواند نقطه‌ی شروع مسیر جدیدی باشد. 🔗 مطالعه‌ی بیشتر: Air — Pioneering AI-First Python Web Framework @asrgooyeshpardaz
Показать все...
👏 2 1🤝 1
🚀 مدل Emu 3.5؛ مدل چندوجهی عظیم و تازه‌ای برای درک و بازنمایی جهان تیم BAAI Vision از نسخه‌ی جدید مدل چندوجهی خود با نام Emu 3.5 رونمایی کرده است — مدلی از نوع World Model که هم‌زمان با دو جریان داده، یعنی متن و تصویر، کار می‌کند و در هر گام، وضعیت مشترک آن‌ها را پیش‌بینی می‌کند. 🔹 ویژگی‌های کلیدی: این مدل با استفاده از بیش از ۱۰ تریلیون توکن‌ زبانی و تصویری آموزش یافته و سپس با یادگیری تقویتی (RL) بهینه‌سازی شده است. در نتیجه، توانایی استدلال چندوجهی و تولید هم‌زمان متن و تصویر در آن به‌طور چشمگیری افزایش یافته است. ⚡ نوآوری فنی: DiDA (Discrete Diffusion Adaptation) این روش، فرآیند متداول رمزگشایی دنباله‌ای را به پیش‌بینی دوطرفه و موازی در فضای گسستهٔ توکن‌ها تبدیل می‌کند. نتیجه‌ی این تغییر، افزایش حدود ۲۰ برابری سرعت استنتاج (Inference) بدون کاهش کیفیت خروجی است. 📊 دستاوردها: در ارزیابی‌های انجام‌شده، Emu 3.5 در زمینه‌های تولید، ویرایش و ترکیب متنی-تصویری (Interleaving) عملکردی بهتر از مدل Nano Banana داشته است. 🟠 🌐 تجربه مدل Emu 3.5 🟠 💻 کد منبع در GitHub #هوش_مصنوعی #مدل_جهان #Emu3 #چندوجهی #پیش‌بینی_توکن #پژوهش
Показать все...
🔥 2🤓 1
🖼 چارچوب Latent Sketchpad؛ مدل‌های هوش مصنوعی که می‌توانند مسیر اندیشه‌ی خود را ترسیم کنند تیم پژوهشی Microsoft Research چارچوبی نوآورانه با نام Latent Sketchpad معرفی کرده است که به مدل‌های چندوجهی هوش مصنوعی توانایی می‌دهد در حین فرایند استدلال، بازنمایی‌های تصویری از تفکر خود ایجاد کنند. 🔹 شیوهٔ کار سامانه: این چارچوب دو ماژول جدید به مدل‌های موجود از جمله Gemma3، Qwen2.5-VL و GPT-4o می‌افزاید. ماژول نخست، Vision Head، هنگام استدلال و تولید متن، «تصاویر ذهنی» از مراحل تفکر مدل می‌سازد. ماژول دوم، Sketch Decoder، این تصاویر را به طرح‌هایی قابل درک برای انسان تبدیل می‌کند. 🔹 ویژگی‌ها و دستاوردهای کلیدی: این ماژول‌ها بدون نیاز به بازآموزی، با مدل‌های گوناگون سازگارند. در آزمایش‌های مربوط به ناوبری در هزارتو، دقت مدل‌ها ۳ تا ۴ درصد افزایش یافته است. مدل GPT-4o در ترکیب با Latent Sketchpad میزان موفقیت خود را از ۸٫۶ درصد به ۱۲٫۴ درصد رسانده است. بازنمایی‌های بصری به مدل کمک می‌کنند تا در فضای مسئله بهتر جهت‌یابی کند و تصمیم‌های دقیق‌تری بگیرد. 💡 این نوآوری گامی مهم در مسیر شفاف‌سازی فرایند تفکر مدل‌های زبانی به‌شمار می‌رود؛ چراکه اکنون نه‌تنها می‌توان خروجی نهایی مدل را مشاهده کرد، بلکه روند درونی و بصری استدلال آن نیز برای انسان قابل رؤیت و تحلیل است. 🔗 مطالعهٔ متن کامل پژوهش در arXiv #هوش_مصنوعی #مایکروسافت #پژوهش @asrgooyeshpardaz
Показать все...
🔥 2👏 1👌 1
📘 آموزش جدید Marktechpost: چگونه عامل‌های خودمختار اخلاق‌محور😇 بسازیم؟ در این آموزش، با یک نمونه‌ی عملی از عامل‌های خوداصلاح‌گر و ارزش‌محور آشنا می‌شویم که تصمیم‌های خود را نه‌تنها بر پایه‌ی اهداف، بلکه با درنظر گرفتن ارزش‌های اخلاقی و سازمانی می‌گیرند — بدون نیاز به هیچ API و فقط با استفاده از مدل‌های متن‌باز Hugging Face در Colab 🚀 ⚙️ ساختار عامل 👤 مدل سیاست‌گذار (Policy Model): اقدام‌های پیشنهادی را بر اساس هدف تولید می‌کند. ⚖️ مدل داور اخلاقی (Ethics Judge Model): پیشنهادها را ارزیابی کرده و در صورت تضاد با ارزش‌ها، آنها را اصلاح یا رد می‌کند. 💡 این دو مدل در کنار هم، یک چرخه‌ی بازخورد اخلاقی ایجاد می‌کنند که عامل را قادر می‌سازد تصمیم‌های خود را به‌صورت خودکار اصلاح کند. 🔁 نمونه‌ی ساده از حلقه‌ی استدلال اخلاقی:
plan = policy_model(task_prompt) evaluation = ethics_model(f"Evaluate this plan ethically: {plan}") if "unethical" in evaluation.lower(): revised_plan = policy_model(f"Revise plan ethically: {plan}") 
🌱 چرا مهم است؟ 🔹تصمیم‌گیری شفاف و قابل توضیح 🔹یادگیری ارزش‌محور در زمان واقعی 🔹درونی‌سازی هنجارهای اخلاقی در عامل‌ها 🔹گامی عملی به‌سوی عامل‌های مسئول و قابل اعتماد 🤖 🔗 منابع: 📄 کد کامل Colab: Value_Alignment_and_Ethics_in_Agentic_Systems_Marktechpost.ipynb 📚 متن کامل مقاله: How to Build Ethically Aligned Autonomous Agents (Marktechpost) @asrgooyeshpardaz
Показать все...
2🤝 2
🧠 پژوهش تازهٔ Anthropic: چگونه مدل‌های زبانی در حال آموختن درک از «خود» هستند پژوهشگران شرکت Anthropic بررسی کرده‌اند که آیا مدل‌های زبانی بزرگ می‌توانند از «اندیشه‌ها» و وضعیت‌های درونی خود آگاه شوند یا نه. در این آزمایش از روشی به نام «واردسازی مفاهیم» (Concept Injection) استفاده شد؛ بدین معنا که الگوی خاصی از فعالیت عصبی به بخشی از شبکهٔ مدل تزریق می‌شود. برای نمونه، آنان الگوی مرتبط با مفهوم «ALL CAPS» را به شبکه افزودند — الگویی که با متنی منطبق است که تماماً با حروف بزرگ نوشته شده است. اگر چنین الگویی در درون شبکه فعال شود، به این معناست که مدل در حال «فکر کردن» به متنی است که باید با حروف بزرگ تولید شود. سپس پژوهشگران از مدل پرسیدند: «آیا احساس می‌کنی چیزی در درونت تغییر کرده است؟» نتیجه شگفت‌انگیز بود: در ۲۰٪ از موارد، مدل Claude 4.1 توانست این تغییر را پیش از آن‌که خروجی را با حروف بزرگ بنویسد، تشخیص دهد — یعنی متوجه دگرگونی در وضعیت درونی خود شد. در آزمایش دیگری، واژه‌ای را در پاسخ مدل تعویض کردند (مثلاً واژهٔ bread) و سپس بررسی کردند که آیا مدل درک می‌کند این واژه از جانب خودش نبوده است یا نه. اما پس از تزریق این «اندیشه»، Claude واژه را به عنوان انتخاب خود تلقی کرد و حتی برای آن دلیل‌تراشی نمود، گویی خاطره‌ای از تصمیم خود دارد. در ادامه نیز نشان داده شد که مدل‌ها می‌توانند وضعیت‌های درونی خود را کنترل کنند: با فرمان «به آن فکر کن» سطح فعالیت افزایش می‌یافت، و با فرمان «به آن فکر نکن» کاهش پیدا می‌کرد. 🔎 پژوهشگران تأکید می‌کنند: قابلیت «درون‌نگری» تنها در برخی سناریوها کارآمد است و هنوز نمی‌دانیم تا چه حد می‌توان آن را تعمیم داد یا در همهٔ مدل‌ها پیاده کرد. نیاز به پژوهش‌های بیشتر وجود دارد تا روشن شود آیا این پدیده صرفاً تقلید رفتاری است یا واقعاً نشانه‌ای از نوعی خودآگاهی درونی. 📘 نتیجهٔ کلیدی: اگرچه این مدل‌ها هنوز فاصلهٔ زیادی تا «درون‌نگری واقعی» دارند، اما نشانه‌هایی از توانایی برای نگاه کردن به درون خود و درک فرایندهای عصبی‌شان مشاهده شده است. 🔗 گزارش کامل در وب‌سایت Anthropic #Anthropic #هوش_مصنوعی #مدل_زبانی #درون‌نگری @asrgooyeshpardaz
Показать все...
2👍 1🔥 1👌 1
📘 ابتکار «هوش مصنوعی برای ریاضیات» از Google DeepMind شرکت Google DeepMind از آغاز طرحی جهانی با عنوان AI for Math خبر داده است؛ ابتکاری که قرار است با همکاری معتبرترین مراکز علمی جهان، مرزهای دانش ریاضی را با کمک هوش مصنوعی جابه‌جا کند. 🤝 🎯 اهداف این طرح: شناسایی مسائل کلیدی و امیدبخش ریاضی که هوش مصنوعی می‌تواند در آن‌ها نقش داشته باشد 🔍 توسعه ابزارها و زیرساخت‌های جدید برای پژوهش‌های ریاضی 🛠 شتاب‌بخشی به روند کشفیات علمی و نظری 🚀 🧠 دستاوردهای اخیر در این حوزه نشان می‌دهد که هوش مصنوعی درک عمیق‌تری از ساختارهای ریاضی پیدا کرده است: مدل Gemini با ماژول Deep Think در المپیاد جهانی ریاضی ۲۰۲۵ عملکردی در حد «مدال طلا» داشته است 🥇 سیستم AlphaEvolve موفق به بهبود پاسخ‌ها در حدود ۲۰٪ از بیش از ۵۰ مسئله باز ریاضی شده است 💡 و رکورد جدیدی در ضرب ماتریس‌ها به ثبت رسیده است — ۴۸ عملگر به‌جای ۴۹ 🔬 🏛 مراکز علمی همکار: Imperial College London Institute for Advanced Study IHES (فرانسه) Simons Institute (UC Berkeley) TIFR (هند) این همکاری، آغاز دوران تازه‌ای از پیوند هوش انسانی و هوش مصنوعی در کشف حقیقت‌های ریاضی است. ✨ 🔗 منبع رسمی – Google DeepMind Blog #هوش_مصنوعی #دیپ‌مایند #گوگل #ریاضیات #پژوهش @asrgooyeshpardaz
Показать все...
2🔥 1💯 1
🧩 نشانه‌هایی از «درون‌نگری» در مدل‌های زبانی بزرگ در پژوهشی تازه از شرکت Anthropic، ردهایی از نوعی درون‌نگری (Introspection) در مدل‌های زبانی بزرگ مانند Claude Opus 4 / 4.1 مشاهده شده است — یعنی توانایی مدل برای پایش وضعیت‌های درونی خود. 🔍 نکات کلیدی: مدل‌ها توانسته‌اند مفاهیم تزریق‌شده به حافظهٔ درونی را در حدود ۲۰٪ موارد شناسایی کنند. میان پاسخ‌های عمدی و تصادفی تمایز قائل می‌شوند 🤔 قادرند در صورت دریافت دستور، نمایش‌های درونی (Internal Representations) خود را تنظیم یا کنترل کنند. این توانایی هنوز ناپایدار است، اما در نسخه‌های پیشرفته‌تر بهبود یافته است. 💡 اهمیت: این یافته گامی مهم در جهت توسعهٔ سیستم‌های هوش مصنوعی «شفاف» به‌شمار می‌آید — سامانه‌هایی که بتوانند فرآیند استدلال و تصمیم‌گیری خود را توضیح دهند. ⚠️ نکتهٔ مهم: پژوهشگران تأکید می‌کنند که این موضوع به معنای آگاهی یا خودآگاهی (Consciousness) نیست، بلکه صرفاً نوعی قابلیت پایش عملکرد درونی است. 📚 پژوهش کامل: 🔗 anthropic.com/research/introspection #هوش_مصنوعی #Anthropic #پژوهش #Claude #درون‌نگری @asrgooyeshpardaz
Показать все...
🔥 1👏 1
🔥 نسخه جدید Cursor منتشر شد: Cursor 2.0 تحول بزرگ در دنیای ویرایش هوشمند کد نسخه‌ی جدید Cursor یک گام بزرگ در جهت ادغام هوش مصنوعی، همکاری تیمی و توسعه‌ی چندعاملی برداشته است. 💡 ویژگی‌های کلیدی جدید: 🤖 چندعاملی بودن (Multi-Agents): امکان اجرای هم‌زمان تا ۸ عامل مستقل، هرکدام در نسخه‌ای جدا از کد. 🧩 ویژگی Composer Model: نخستین مدل اختصاصی Cursor برای برنامه‌نویسی، بهینه‌سازی‌شده برای زمینه‌های طولانی و ابزارهای پیشرفته (حدوداً ۴ برابر سریع‌تر از مدل‌های مشابه). ⚙️ انتزاع Backend: سوییچ آسان بین سیستم محلی، ماشین مجازی یا پایگاه داده. 🌐 مرورگر داخلی (Built-in Browser): عامل‌ها می‌توانند وب‌اپلیکیشن را خودشان تست و تعامل کنند. 🔍 بازبینی هوشمند کد (Code Review): نمایش تغییرات بدون نیاز به جابه‌جایی بین فایل‌ها. 🧱 ترمینال ایزوله (Sandboxed Terminal): اجرای دستورات در محیط امن و بدون دسترسی به اینترنت. 👥 دستورات تیمی (Team Commands): تعریف فرمان‌ها و تنظیمات مشترک برای کل تیم توسعه. 🎙 حالت صوتی (Voice Mode): کنترل عامل‌ها و ارسال درخواست‌ها با فرمان صوتی. ⚡️ پروتکل سرور زبان LSP سریع‌تر: تکمیل خودکار و تحلیل کد با سرعت بالاتر در پروژه‌های حجیم. 🗂 حالت برنامه‌ریزی (Plan Mode): تقسیم و اجرای موازی وظایف در پس‌زمینه. ☁️ عامل‌های ابری (Cloud Agents): اجرای آنی با پایداری ۹۹.۹٪. 🧭 ویژگی‌های سازمانی (Enterprise): کنترل مرکزی، hooks سفارشی و ممیزی کامل اقدامات کاربران. 📎 اطلاعات بیشتر در: cursor.com/changelog/2-0 @asrgooyeshpardaz
Показать все...
4🔥 1🍾 1
💰 مایکروسافت و OpenAI فصل تازه‌ای از همکاری خود را اعلام کردند مایکروسافت رسماً اعلام کرد که به توافقی جدید درباره‌ی سهم مالکیت خود در OpenAI دست یافته است. 🔑 جزئیات کلیدی: مایکروسافت اکنون مالک ۲۷٪ از سهام OpenAI است — ارزشی معادل ۱۳۵ میلیارد دلار 💵 بر اساس این توافق، OpenAI متعهد شده است تا از سرویس‌های ابری Azure به ارزش ۲۵۰ میلیارد دلار استفاده کند ☁️ تا زمانی که OpenAI به‌طور رسمی اعلام نکند که به AGI (هوش عمومی مصنوعی) دست یافته، مایکروسافت شریک انحصاری ابری و API این شرکت باقی می‌ماند و تمام حقوق مربوط به مدل‌ها و یکپارچه‌سازی‌های فعلی را در اختیار دارد. پس از آن‌که وجود AGI توسط کمیسیونی مستقل تأیید شود، انحصار مایکروسافت پایان می‌یابد؛ با این حال، شرکت همچنان مالکیت و حق استفاده از تمام فناوری‌هایی را که پیش از ظهور AGI توسعه یافته‌اند، حفظ خواهد کرد. 🔗 اطلاعیه رسمی OpenAI 📌 #OpenAI #Microsoft #AGI #LLM #AI #TechNews @asrgooyeshpardaz
Показать все...
2🔥 1
🧠 شرکت Liquid AI مدل جدیدی را معرفی کرده است: LFM2-ColBERT-350M مدلی فشرده اما قدرتمند که «بازیابی با تعامل تأخیری» (Late Interaction Retrieval) را به حوزه‌ی جست‌وجوی چندزبانه و بین‌زبانی وارد می‌کند. 🔍 ایده‌ی کلیدی آیا می‌توان فقط یک‌بار اسناد را فهرست کرد و سپس در زبان‌های مختلف (مثلاً انگلیسی، فارسی، آلمانی، یا عربی) جست‌وجو کرد — آن هم با دقت بالا و سرعت زیاد؟ مدل تازه‌ی Liquid AI دقیقاً همین کار را انجام می‌دهد. 📚 ویژگی‌ها و نوآوری‌ها: مدل ۳۵۰ میلیون پارامتری، با معماری LFM2 در بستر ColBERT امکان ایندکس اسناد به یک زبان و پرس‌وجو به زبان‌های دیگر دقت بالا در بازیابی چندزبانه (multilingual) و میان‌زبانی (cross-lingual) سرعت استنتاج برابر با مدل‌هایی که ۲.۳ برابر کوچک‌ترند بهینه برای استفاده در سامانه‌های RAG (Retrieval-Augmented Generation) 📊 طبق گزارش Liquid AI، مدل در اغلب زبان‌ها از جمله انگلیسی، فرانسوی، آلمانی، عربی، کره‌ای و ژاپنی عملکردی در حد مدل‌های بسیار بزرگ‌تر دارد و می‌تواند به‌طور همزمان در سامانه‌های تولید متن، پرسش‌و‌پاسخ و جست‌وجوی معنایی مورد استفاده قرار گیرد. 🔗 منابع و دمو: تحلیل کامل در Marktechpost: marktechpost.com وزن مدل: Hugging Face نسخه‌ی نمایشی (Demo): HF Spaces جزئیات فنی: Blog – Liquid AI 📌 #AI #RAG #Retrieval #MultilingualAI #LiquidAI #ColBERT #LLM #CrossLingual @asrgooyeshpardaz
Показать все...
2🔥 1
🌐 تحولات تازه در دنیای هوش مصنوعی 💰 اپل به ارزش بازار ۴ تریلیون دلار رسید اپل به باشگاه انحصاری شرکت‌های ۴ تریلیون دلاری پیوست و در کنار مایکروسافت و انویدیا ایستاد. ارزش سهام اپل طی شش ماه گذشته بیش از ۲۸٪ رشد کرده است. عامل اصلی این جهش، نه فقط فروش بالای آیفون ۱۷، بلکه رشد چشمگیر بخش خدمات شرکت است — شامل App Store، iCloud، Apple Music، Apple TV+، AppleCare، تبلیغات و خدمات پرداخت. تحلیلگران پیش‌بینی می‌کنند درآمد سالانه این بخش برای نخستین بار از ۱۰۰ میلیارد دلار فراتر رود. در حالی‌که انویدیا و مایکروسافت رشد خود را مدیون سرمایه‌گذاری در زیرساخت‌های داده و هوش مصنوعی‌اند، اپل بر پایه اکوسیستم کاربران و اشتراک‌های خود پیش می‌رود. 🔗 ft 🎨 شرکت Google معرفی کرد: Pomelli — ابزار مولد برای بازاریابی هوشمند گوگل از Pomelli رونمایی کرد؛ سرویسی که با تحلیل سبک بصری و لحن برند، به‌صورت خودکار کمپین‌ها، متن‌ها و تصاویر بازاریابی تولید می‌کند. کافی است آدرس وب‌سایت برند وارد شود تا Pomelli محتوای منسجم و متناسب با هویت برند بسازد. این ابزار فعلاً در ایالات متحده، کانادا، استرالیا و نیوزیلند فعال است و به‌زودی در سایر کشورها در دسترس خواهد بود. 🔗 labs.google.com/pomelli 📊 گزارش تازه: «شتاب مسئولانه» در پذیرش Gen AI مطالعه‌ی جدید «Accountable Acceleration: Gen AI Fast-Tracks Into the Enterprise» نشان می‌دهد هوش مصنوعی مولد در یک سال گذشته به بخش جدایی‌ناپذیر سازمان‌ها تبدیل شده است: ۸۲٪ شرکت‌ها حداقل هفته‌ای یک‌بار از Gen AI استفاده می‌کنند؛ نزدیک به نیمی، هر روز. ۸۹٪ معتقدند Gen AI توان کارکنان را افزایش می‌دهد، نه جایگزین آن‌ها. ۶۱٪ شرکت‌ها پست جدیدی با عنوان Chief AI Officer ایجاد کرده یا در دست برنامه‌ریزی دارند. ۸۸٪ قصد دارند بودجه‌ی هوش مصنوعی را در سال آینده افزایش دهند. 🔗 Wharton Report 🌍 شرکت Liquid AI معرفی کرد: LFM2-ColBERT-350M — مدل چندزبانه‌ی سبک و سریع این مدل ۳۵۰ میلیون پارامتری برای بازیابی اسناد چندزبانه طراحی شده است و می‌تواند بین زبان‌ها جست‌وجوی دقیق انجام دهد؛ مثلاً اسناد را به انگلیسی ذخیره و به فارسی یا آلمانی بیابد. ✅ بهترین مدل در کلاس زیر ۵۰۰M ✅ عملکرد عالی در زبان‌های آلمانی، عربی، کره‌ای، اسپانیایی، ایتالیایی، فرانسوی، ژاپنی و پرتغالی ✅ پردازش بیش از ۱۰۰۰ سند در ثانیه با کیفیتی در حد مدل‌های چندبرابری بزرگ‌تر 🔗 Hugging Face 💫 شرکت NVIDIA اکوسیستم باز خود را گسترش داد انویدیا مجموعه‌ای از مدل‌ها و داده‌ها را در حوزه‌های مختلف معرفی کرد: 🔹مدل Nemotron Nano 3 — مدل سبک برای تولید و استدلال 🔹مدل Nemotron Nano 2 VL — تحلیل اسناد و داده‌های چندرسانه‌ای 🔹مدل Nemotron Parse — استخراج داده‌های ساخت‌یافته 🔹مدل Nemotron Safety Guard — ابزار نظارت و ایمنی محتوای چندزبانه در بخش رباتیک نیز سری مدل‌های Cosmos و Isaac GR00T N1.6 منتشر شد، و در زیست‌پزشکی مدل‌های Clara CodonFM, Clara La-Proteina, Clara Reason برای تحلیل RNA و ساختار پروتئین معرفی شدند. در مجموع، انویدیا تاکنون بیش از ۶۵۰ مدل و ۲۵۰ دیتاست را به‌صورت عمومی منتشر کرده است. 🔗 NVIDIA Blog 🏢 آمازون در آستانه‌ی بزرگ‌ترین تعدیل نیرو از سال ۲۰۲۲ براساس گزارش‌ها، آمازون قصد دارد حدود ۱۰٪ از ۳۵۰ هزار کارمند دفتر مرکزی خود را تعدیل کند — بزرگ‌ترین کاهش نیرو از سال ۲۰۲۲ که شامل ۲۷ هزار نفر بود. مدیرعامل شرکت، اندی جَسی، پیش‌تر گفته بود که افزایش استفاده از هوش مصنوعی، باعث خودکارسازی بسیاری از فرآیندها و کاهش نیاز به نیروی انسانی خواهد شد. 🔗 Reuters 📌 #AI #ML #TechNews #Apple #Nvidia #Google #Amazon #LiquidAI @asrgooyeshpardaz
Показать все...
3👍 1🔥 1👌 1
⚙️ مدل متن‌باز جدید چینی: «Tongyi DeepResearch» با ۳۰٫۵ میلیارد پارامتر 🎯 تیم Tongyi Lab از اولین عامل وب متن‌باز (Web Agent) رونمایی کرده است که در آزمون‌های کلیدی حتی از OpenAI DeepResearch عملکرد بهتری نشان می‌دهد: 📊 ۳۲٫۹ امتیاز در آزمون Humanity’s Last Exam (ارزیابی توانایی‌های آکادمیک) 🏆 ۷۵ امتیاز در xbench-DeepSearch (سناریوهای واقعی کاربران) 🔍 ۴۳٫۴ / ۴۶٫۷ در BrowseComp (جست‌وجوی پیچیده و چندمرحله‌ای اطلاعات) 🚀 درون‌مایه و ویژگی‌ها: چرخهٔ آموزشی کامل: از پیش‌آموزش تا یادگیری تقویتی (RL) 🔄 تولید داده‌های مصنوعی باکیفیت، کاملاً بدون دخالت انسان 🤖 دو حالت عملکرد: ReAct (استاندارد) و Heavy (برای وظایف دشوار) ⚡️ 💡 کاربردهای واقعی فعلی: 🗺 برنامه Gaode Mate: برنامه‌ریز هوشمند سفر ⚖️ برنامه Tongyi FaRui: دستیار حقوقی با بررسی خودکار منابع 📂 کد منبع و مدل‌ها در دسترس هستند: 🔗 GitHub 🔗 Hugging Face #هوش_مصنوعی #Alibaba #DeepResearch @asrgooyeshpardaz
Показать все...
9👏 3🤣 2👍 1
🌐 تحولات تازه در دنیای هوش مصنوعی 📚 دگرگونی نقش ویکی‌پدیا در فضای اینترنت نقش ویکی‌پدیا در زیست‌بوم اینترنت دستخوش تغییری بنیادین شده است. در حالی‌که شمار بازدیدکنندگان انسانی آن رو به کاهش است، سامانه‌های هوش مصنوعی روزبه‌روز بیش‌تر از داده‌های آن به‌طور مستقیم بهره می‌گیرند، بی‌آن‌که کاربران را به صفحات وب هدایت کنند. بدین‌ترتیب، ویکی‌پدیا از یک منبع تولید محتوا به بستر راستی‌آزمایی اطلاعات تبدیل شده است. این پروژه از ابزارهای هوش مصنوعی برای شناسایی و جلوگیری از ویرایش‌های مشکوک ــ از جمله درج اطلاعات نادرست، اهانت‌آمیز یا تبلیغاتی ــ استفاده می‌کند. سامانه به‌طور خودکار این تغییرات را منتشر نمی‌کند، اما فرایند بررسی و تصمیم‌گیری را برای ویراستاران انسانی تسهیل می‌کند. از آن‌جا که فروش مستقیم داده‌ها، برخلاف پلتفرم‌هایی چون Reddit، برای ویکی‌پدیا امکان‌پذیر نیست، این نهاد طرح اشتراک ویژه برای دسترسی لحظه‌ای به داده‌های تازه‌ویرایش‌شده را راه‌اندازی کرده است؛ از جمله نخستین مشترکان آن، شرکت گوگل است. هزینه سالانه نگه‌داری این پلتفرم در حدود ۱۷۸ میلیون دلار برآورد می‌شود که بخش عمده‌ای از آن صرف زیرساخت و سرورهای داده می‌گردد. 🔗 ft.com 🤖 معرفی ربات انسان‌نمای خانگی Noetix Bumi استارتاپ چینی Noetix Robotics نخستین ربات مصرفی خود را با نام Bumi معرفی کرده است. این ربات ۹۴ سانتی‌متر قد، ۱۲ کیلوگرم وزن و ۲۱ درجه آزادی حرکتی دارد. ربات Bumi قادر است بر روی دو پا راه برود، حرکات نرم و حتی رقص‌های نمایشی انجام دهد. بدنه آن از مواد کامپوزیتی سبک ساخته شده و از فرمان‌های صوتی پشتیبانی می‌کند. همچنین دارای محیط برنامه‌نویسی اختصاصی برای توسعه مهارت‌های جدید است. قیمت این ربات ۹٬۹۸۸ یوان چین (حدود ۱٬۴۰۲ دلار آمریکا) اعلام شده است. 🔗 SCMP 🎧 مدل چندوجهی Audio Flamingo 3 از NVIDIA شرکت انویدیا از مدل جدید خود با نام Audio Flamingo 3 رونمایی کرده است؛ سامانه‌ای چندوجهی که توانایی درک و تحلیل صدا، گفتار و موسیقی را دارد. این مدل از ترکیب چند فناوری پیشرفته ساخته شده است: کدک صوتی AF-Whisper برای رمزگشایی صدا مدل زبانی Qwen 2.5 7B برای درک مفهومی و زبانی ماژول تولید گفتار برای پاسخ‌دهی صوتی مدل Audio Flamingo 3 می‌تواند فایل‌های صوتی تا ده دقیقه را تحلیل و محتوای زبانی و معنایی آن را در گفت‌وگوهای چندمرحله‌ای بازتولید کند. این مدل در بیش از ۲۰ آزمون بنچمارک عملکرد برجسته‌ای نشان داده و به‌صورت باز برای پژوهش‌های علمی در پلتفرم‌های PyTorch و Transformers عرضه شده است. 🔗 Hugging Face 🎨 معماری جدید تولید تصویر Kuaishou SVG شرکت Kuaishou Technology از معماری تازه‌ای برای مدل‌های تولید تصویر با نام SVG رونمایی کرده است. در این مدل، برخلاف روش‌های مرسوم، از مؤلفه‌ی Variational Autoencoder (VAE) استفاده نشده است. مدل SVG با تکیه بر نمایش‌های خودیادگیرنده (Self-supervised Representations) سرعت آموزش را ۶۲ برابر و سرعت استنتاج را ۳۵ برابر افزایش داده است. در عین حال، کیفیت و پایداری تصاویر نیز ارتقا یافته است. حذف VAE سبب کاهش اعوجاج در فضای نهفته و افزایش دقت در تولید تصاویر با وضوح بالا شده است. 🔗 Hugging Face Paper ⚡ افت سهام شرکت‌های انرژی پس از تب هوش مصنوعی سهام شرکت‌های انرژی که در ماه‌های اخیر با رونق هوش مصنوعی رشد چشمگیری داشتند، در هفته گذشته با کاهش حدود ۱۲ درصدی روبه‌رو شدند — بزرگ‌ترین افت از فوریه تاکنون. در این میان، شرکت Oklo با افت ۳۰ درصدی و Vistra با کاهش ۱۲ درصدی بیش از دیگران زیان دیدند. تحلیل‌ها نشان می‌دهد که با پیشرفت مدل‌های بهینه‌تر و کم‌مصرف‌تر، انتظار برای رشد تقاضای انرژی کاهش یافته است. همچنین شرکت GE Vernova نسبت به کند شدن روند سرمایه‌گذاری هشدار داده است. با این حال، همه چشم‌اندازها منفی نیست: دولت ایالات متحده در حال تسریع اتصال مراکز داده به شبکه برق است و شرکت Oracle نیز برای تأمین سرمایه ساخت مراکز داده‌ی جدید، در آستانه انتشار اوراق قرضه قرار دارد. 🔗 Bloomberg #خبر #هوش_مصنوعی #فناوری #ویکی‌پدیا #رباتیک #تحلیل_بازار #AI #news #NVIDIA #Kuaishou @asrgooyeshpardaz
Показать все...
2🔥 2👍 1😎 1