[ad_1]
Agen AI siap untuk menyediakan hingga $ 450 miliar pada tahun 2028 dari pertumbuhan pendapatan dan pengurangan biaya. Menurut Capgemini. Pengembang yang membangun agen -agen ini beralih ke model inferensi kinerja yang lebih baik untuk meningkatkan platform agen AI dan sistem AI fisik.
Di Siggraph, NVIDIA hari ini mengumumkan perluasan dua keluarga model dengan kemampuan inferensi. Nvidia nemotron Dan nvidia cosmos – Apa yang digunakan oleh para pemimpin industri untuk mendorong produktivitas melalui tim agen AI dan robot humanoid.
CrowdStrike, Uber, Magna, NetApp dan Zoom adalah beberapa perusahaan yang menggunakan keluarga model ini.
Model NVIDIA Nemotron Nano 2 dan Llama Nemotron Super 1.5 yang baru menawarkan akurasi tertinggi dalam inferensi ilmiah, matematika, pengkodean, panggilan alat, publikasi pengajaran, dan kategori ukuran obrolan. Model -model baru ini memberdayakan agen AI untuk berpikir lebih dalam dan bekerja lebih efisien. Jelajahi berbagai opsi yang lebih luas, mempercepat penelitian Anda dan memberikan hasil yang lebih cerdas dalam batas waktu yang ditetapkan.
Pikirkan model sebagai otak agen AI. Memberikan kecerdasan inti. Tetapi untuk membuat otak itu bermanfaat bagi bisnis Anda, Anda harus tertanam dalam agen yang memahami dan mengoperasikan alur kerja tertentu selain terminologi industri dan bisnis. NVIDIA membantu bisnis dengan perpustakaan utama dan cetak biru AI untuk di atas kapal, menyesuaikan dan mengelola agen AI besar untuk mengisi celah itu.
Alasan Cosmos Ini alasan baru Model Bahasa Visi (VLM) AI fisik Aplikasi yang sangat baik untuk memahami bagaimana dunia nyata bekerja, menggunakan inferensi terstruktur untuk memahami konsep-konsep seperti fisika, kegigihan objek, penyelarasan ruang-waktu, dan banyak lagi.
Alasan Cosmos bertujuan untuk berfungsi sebagai tulang punggung inferensi dari model robotika dan aksi bahasa (VLA), atau sebagai data pelatihan kritik dan keterangan untuk robotika dan kendaraan otonom, dan, seperti pabrik dan kota, agen AI visual run-time dilengkapi dengan pemahaman spasial dan inferensi operasi fisik.
Nemotron: Agen Enterprise AI adalah yang paling akurat dan efisien
Saat bisnis mengembangkan agen AI dan menangani tugas multi-langkah yang kompleks, model yang dapat secara efisien memberikan akurasi inferensi yang kuat token Generasi memungkinkan keputusan yang cerdas dan otonom pada skala.
NVIDIA NEMOTRON adalah keluarga model inferensi yang sangat terbuka menggunakan model kunci, kumpulan data terbuka NVIDIA, dan teknologi AI canggih untuk memberikan titik awal yang akurat dan efisien untuk agen AI.
Model nemotron terbaru memberikan efisiensi timbal dalam tiga cara: arsitektur model hybrid baru, model kuantum yang ringkas, dan anggaran berpikir yang dapat dikonfigurasi yang memungkinkan pengembang untuk mengontrol pembuatan token. Kombinasi ini memungkinkan model untuk bernalar lebih dalam dan merespons lebih cepat, tanpa perlu lebih banyak waktu atau daya komputasi. Ini berarti hasil yang lebih baik dengan biaya lebih rendah.
Nemotron Nano 2 menawarkan generasi token enam kali lebih tinggi dibandingkan dengan model utama lainnya dari ukurannya.
Llama Nemotron Super 1.5 mencapai kinerja utama dan akurasi inferensi terbaik di kelas, memungkinkan agen AI untuk meningkatkan inferensi yang lebih baik, membuat keputusan yang lebih cerdas, dan menangani tugas -tugas kompleks secara mandiri. Sekarang tersedia di NVFP4 atau 4-bit floating point. Ini memberikan throughput enam kali lebih tinggi pada GPU NVIDIA B200 dibandingkan dengan GPU NVIDIA H100.

Bagan di atas menunjukkan bahwa model nemotron memberikan akurasi inferensi tertinggi dengan kerangka waktu yang sama dan anggaran perhitungan yang sama, memberikan akurasi tertinggi per dolar.
Selain dua model nemotron baru, NVIDIA juga meluncurkan dataset pelatihan VLM terbuka pertama (LLAMA NEMOTRON VLM Dataset V1) menggunakan 3 juta pengenalan karakter optik, QA visual QA dan Caption pada model LLAMA 3.1 Nemotron Nano VL 8B.
Selain keakuratan model inferensi, agen juga tergantung Generasi yang dicari Dapatkan informasi terbaru dan paling relevan dari data yang terhubung di berbagai sumber untuk membuat keputusan berdasarkan informasi. Model embedding Nemo Retriever Retriever yang baru -baru ini dirilis melampaui tiga peringkat perolehan dokumen visual – Vidore V1, Vidore V2 Dan MTEB VisualDocumentRetrieval – Untuk meningkatkan keakuratan sistem agen.

Menggunakan model pengambilan informasi dan informasi ini, agen penelitian mendalam yang dibangun menggunakan cetak biru AI-Q NVIDIA saat ini adalah agen terbuka dan portabel nomor satu. Bangku Deepresearch.
nvidia nemo Dan nvidia nim Layanan microser mendukung seluruh siklus hidup agen AI, dari pengembangan dan penyebaran hingga pemantauan dan optimalisasi sistem agen.
Alasan Cosmos: Terobosan AI fisik

VLM menandai terobosan dalam visi komputer dan robotika, memungkinkan mesin untuk mengidentifikasi objek dan pola. Namun, VLM non-adaptif tidak memiliki kemampuan untuk memahami dan berinteraksi dengan dunia nyata. Ini berarti bahwa ia tidak dapat menangani ambiguitas, pengalaman baru, atau menyelesaikan tugas multi-tahap yang kompleks.
Alasan Nvidia Cosmos VLM inferensi parameter 7 miliar baru yang dapat disesuaikan untuk AI fisik dan robotika. Untuk alasan Cosmos, robot dan visi agen AI dapat memahami dan bertindak dalam dunia fisik, menggunakan pengetahuan sebelumnya, pemahaman fisika dan akal sehat, untuk alasan seperti manusia.
Alasan Cosmos termasuk kritik dan keterangan data robotika dan pelatihan, keputusan robot, Agen AI Analytics Video.
Ini membantu untuk mengotomatisasi kurasi dan anotasi set data pelatihan yang besar dan beragam dan mempercepat pengembangan model AI presisi tinggi. Ini juga berfungsi sebagai mesin inferensi canggih untuk perencanaan robot, memungkinkan Anda untuk menganalisis instruksi kompleks dengan langkah -langkah praktis dalam model VLA, bahkan di lingkungan baru.
Ini juga memiliki kekuatan untuk agen AI analitik video yang dibangun di atas. nvidia blueprint (VSS) untuk pencarian dan ringkasan videoDiaktifkan oleh Metropolis Nvidia Kumpulkan wawasan berharga dari platform, sejumlah besar penyimpanan atau data video langsung. Agen AI yang perseptif secara visual dan interaktif ini dapat membantu merampingkan operasi di pabrik, gudang, toko ritel, bandara, persimpangan transportasi, dan banyak lagi dengan mendeteksi anomali.
Tim peneliti robot NVIDIA menggunakan alasan COSMOS untuk penyaringan dan kurasi data, menggunakan VLM inferensi “System 2” di belakang model VLA seperti versi berikutnya dari NVIDIA Isaac GR00T NX.
Saat ini menawarkan layanan: Model inferensi NVIDIA untuk agen dan robot AI
Berbagai perusahaan dan pemimpin konsultasi menggunakan model inferensi terbaru NVIDIA. Para pemimpin di seluruh bekerja cybersecurity bekerja dengan Nemotoron untuk membangun agen AI perusahaan, dari telekomunikasi.
Zoom berencana untuk memanfaatkan model penalaran nemotron menggunakan Zoom AI Companions untuk membuat keputusan dan mengelola tugas multi-tahap yang mengambil tindakan kepada pengguna dalam rapat zoom, zoom chat dan zoom dokumen.
CrowdStrike sedang menguji model Nemotron sehingga agen Charlotte AI dapat menulis pertanyaan ke platform CrowdStrike Falcon.
AMDOCS menggunakan model NVIDIA NEMOTRON di Amaiz Suite untuk mendorong agen AI untuk menangani perawatan spaning otomatis, penjualan, jaringan, jaringan, dan dukungan pelanggan yang kompleks dan multi-tahap.
EY mengadopsi Nemotronnano 2 untuk throughput dan pendukung agen AI yang tinggi di organisasi besar untuk pajak, manajemen risiko, dan kasus penggunaan keuangan.
NetApp saat ini sedang menguji model penalaran nemotron untuk memungkinkan agen AI mencari dan menganalisis data bisnis
DATAROBOT Kami berkolaborasi dengan model nemotron dari platform tenaga kerja agen untuk manajemen siklus hidup agen end-to-end.
Tabnine Kami bekerja dengan model Nemotron untuk mengusulkan dan mengotomatisasi tugas pengkodean atas nama pengembang.
Otomatisasi di mana -mana, Kuruwai DataIKU adalah salah satu pengembang perangkat lunak AI agen tambahan yang mengintegrasikan model Nemotron ke dalam platform.
Perusahaan besar di seluruh transportasi, keselamatan dan intelijen AI menggunakan alasan Cosmos untuk meningkatkan mengemudi otonom, analisis video, dan keselamatan jalan dan tempat kerja.
Uber sedang mengeksplorasi alasan alam semesta untuk menganalisis perilaku kendaraan otonom. Selain itu, Uber adalah alasan bagi kosmos pasca-pelatihan untuk merangkum data visual, menganalisis skenario seperti pejalan kaki yang berkeliaran di jalan raya, melakukan analisis kualitas, dan menganalisis skenario seperti memberi tahu perilaku mengemudi yang otonom.
Alasan Cosmos adalah bahwa ia juga berfungsi sebagai otak mobil yang bisa mengemudi sendiri. Robot menafsirkan lingkungan dan diberi perintah yang kompleks, sehingga memecahnya menjadi tugas dan menjalankannya menggunakan akal sehat bahkan di lingkungan yang tidak dikenal.
Centrific menguji alasan Cosmos untuk meningkatkan platform intelijen video bertenaga AI. VLM memungkinkan platform untuk memproses data video yang kompleks menjadi wawasan yang dapat ditindaklanjuti, mengurangi positif palsu dan meningkatkan efisiensi pengambilan keputusan.
Sangat luas Menggunakan sistem operasi AI, kami menggunakan alasan NVIDIA COSMOS untuk memajukan kecerdasan perkotaan real-time untuk memproses aliran video besar. Cetak biru VSS memungkinkan agen raksasa untuk membangun agen yang dapat mengidentifikasi insiden, memicu respons, dan mengubah aliran video dan metadata menjadi alat keselamatan publik yang dapat ditindaklanjuti dan agresif.
Ambient.ai Bekerja dengan inferensi pengenalan fisik sementara Cosmos Reason, ini memungkinkan deteksi otomatis peralatan pelindung pribadi dan pemantauan kondisi berbahaya, meningkatkan kesehatan lingkungan dan keselamatan di seluruh konstruksi, manufaktur, logistik, dan lingkungan industri lainnya.
Magna Ini sedang dikembangkan karena alasan Cosmos sebagai bagian dari platform distribusi perkotaan. Ini adalah solusi yang sepenuhnya otonom dan berbiaya rendah untuk pengiriman segera. Model ini menambah pemahaman global pada rencana lintasan jangka panjang kendaraan.
Model -model ini diharapkan tersedia sebagai nvidia nim Layanan Microser untuk penyebaran yang aman dan andal pada infrastruktur percepatan NVIDIA untuk privasi dan kontrol maksimum. Mereka akan segera tersedia melalui Amazon Bedrock dan Amazon Sagemaker AI untuk model Nemotron, serta Azure AI Foundry, Oracle Data Science Platform, dan Google Vertex AI.
mencoba Mengapa Cosmos Burnion.nvidia.com Atau unduh Memeluk wajahku atau GitHub.
Nemotron Nano 2 dan Llama Nemotron Super 1.5 (NVFP4) akan tersedia untuk diunduh segera. Sementara itu, Lihat detail model nemotron dan unduh versi sebelumnya.
Silakan unduh Llama Nemotron VLM Dataset V1 Dari memeluk wajahnya.
Tolong lihatlah Siggraph's Nvidia Research Special Onders Dan dengan bergabung dengan Nvidia di konferensi, yang berlangsung hingga Kamis, 14 Agustus, kita akan belajar lebih banyak tentang bagaimana grafik dan inovasi simulasi dapat mendorong digitalisasi industri.
Lihat Beri tahu saya Mengenai informasi produk perangkat lunak.


