Amazon sedang mempersiapkan untuk meluncurkan chip intelijen buatan terbaru (AI) sebagai konglomerat teknologi besar berupaya untuk mendapatkan pengembalian dari miliaran dolar dalam investasi semikonduktor dan mengurangi ketergantungannya pada pemimpin pasar Nvidia.
Para eksekutif divisi komputasi awan Amazon sangat berinvestasi dalam chip yang disesuaikan, berharap dapat meningkatkan efisiensi lusinan pusat data dan pada akhirnya mengurangi biaya untuk dirinya sendiri dan pelanggan Amazon AWS.
Pekerjaan ini dipimpin oleh Annapurna Labs, startup chip yang berbasis di Austin, yang diperoleh Amazon sebesar $ 350 juta pada awal 2015. Prestasi terbaru Annapurna diharapkan akan dipamerkan pada bulan Desember, ketika Amazon akan mengumumkan ketersediaan luas "Flielium 2", yang manaadalah bagian dari seri chip AI yang dirancang untuk melatih model terbesar.
Falium 2 sudah menjalani pengujian oleh Anthropic (pesaing Openai, yang telah menerima dukungan $ 4 miliar dari Amazon), serta VNET, Deutsche Telekom, Ricoh Jepang, dan Stockmark.
Amazon AWS dan Annapurna bertujuan untuk bersaing dengan Nvidia, yang telah menjadi salah satu perusahaan paling berharga di dunia karena posisinya yang dominan di pasar chip AI.
Kami berharap menjadi tempat terbaik untuk menjalankan chip NVIDIA, "kata Dave Brown, wakil presiden layanan komputasi dan jaringan di Amazon AWS. Tetapi pada saat yang sama, kami percaya bahwa mengadopsi solusi alternatif bermanfaat," kata Amazon, yang menyatakan bahwa itu"Inferentia" chip profesional lainnya telah mengurangi biaya operasi sebesar 40% dan dapat digunakan untuk model AI generatif yang responsif.
Amazon sekarang mengharapkan pengeluaran modal sekitar $ 75 miliar pada tahun 2024, dengan mayoritas menuju infrastruktur teknologi.Selama panggilan konferensi pendapatan terbaru perusahaan, CEO Andy Jassy menyatakan bahwa ia mengharapkan perusahaan memiliki lebih banyak biaya pada tahun 2025.
Ini adalah peningkatan dari pengeluaran setahun penuh 48,4 miliar dolar AS pada tahun 2023. Penyedia cloud terbesar, termasuk Microsoft dan Google, berinvestasi banyak dalam kecerdasan buatan, dan tren ini menunjukkan sedikit tanda pelemahan.
Amazon, Microsoft, dan Meta semuanya adalah pelanggan utama NVIDIA, tetapi mereka juga merancang chip pusat data mereka sendiri untuk meletakkan dasar bagi gelombang pertumbuhan AI yang mereka antisipasi.
Daniel Newman dari Futurum Group berkata, "Setiap penyedia awan besar bergeser ke arah yang lebih vertikal, dan jika memungkinkan, bergerak menuju tumpukan 'teknologi chip' yang homogen dan terintegrasi
Newman menunjukkan bahwa "dari Openai ke Apple, semua orang berusaha membangun chip mereka sendiri" karena mereka mencari "biaya produksi yang lebih rendah, margin laba yang lebih tinggi, ketersediaan yang lebih tinggi, dan lebih banyak kontrol".
Setelah mulai membangun chip keamanan "nitro" untuk AWS, Annapurna telah mengembangkan beberapa generasi graviton, unit pemrosesan pusat berbasis lengan (CPU) yang menyediakan alternatif daya rendah untuk mainframe server tradisional yang disediakan oleh Intel atau AMD.
Analis TechInsights G Dan Hutcheson mengatakan, 'Salah satu keuntungan utama AWS adalah bahwa chip mereka dapat menggunakan lebih sedikit daya, dan pusat data mereka mungkin lebih efisien,' dengan demikian mengurangi biaya.Dia mengatakan bahwa jika unit pemrosesan grafis NVIDIA (GPU) adalah alat tujuan umum yang kuat (untuk mobil seperti station wagon), maka Amazon dapat mengoptimalkan chipnya untuk tugas dan layanan tertentu (seperti mobil kompak atau hatchback).
Namun, sejauh ini, AWS dan Annapurna hampir tidak melemahkan posisi dominan Nvidia dalam infrastruktur AI.
Pendapatan penjualan chip pusat data AI NVIDIA mencapai $ 26,3 miliar pada kuartal kedua tahun fiskal 2024. Angka ini sama dengan pendapatan seluruh divisi AWS yang diumumkan oleh Amazon pada kuartal kedua.Dilaporkan bahwa hanya sebagian kecil dari itu yang dapat dikaitkan dengan pelanggan yang menjalankan beban kerja AI pada infrastruktur Annapurna.
Adapun kinerja mentah chip AWS dan chip NVIDIA, Amazon menghindari perbandingan langsung dan tidak mengirimkan chip mereka ke tolok ukur kinerja independen.
Konsultan Chip Moor Insights & Strategi Patrick Moorhead percaya bahwa klaim Amazon tentang peningkatan kinerja 4 kali lipat antara Flielium 1 dan Flielium 2 akurat, karena ia telah meninjau perusahaan selama bertahun-tahun.Tetapi data kinerja mungkin tidak sama pentingnya dengan menyediakan lebih banyak pilihan kepada pelanggan.
Orang -orang menghargai semua inovasi yang dibawa oleh Nvidia, tetapi tidak ada yang ingin melihat Nvidia menempati 90% dari pangsa pasar, "tambahnya."Situasi ini tidak akan bertahan lama