OpenAI secara aktif mengamankan sumber daya komputasi AI-nya dengan perjanjian baru dengan Amazon Web Services (AWS) sebagai bagian dari strategi multi-cloud-nya. Ini mengikuti keputusan perusahaan baru-baru ini untuk mengakhiri kemitraan eksklusifnya dengan Microsoft. OpenAI telah mengalokasikan sekitar $250 miliar untuk Microsoft, $300 miliar untuk Oracle, dan sekarang $38 miliar untuk AWS dalam kontrak multi-tahun. Meskipun kesepakatan AWS adalah yang terkecil dari ketiga, ini merupakan bagian penting dari strategi OpenAI untuk mendiversifikasi sumber daya cloud-nya.
Langkah-langkah yang diambil oleh OpenAI menunjukkan bahwa akses ke GPU berkinerja tinggi telah menjadi sumber daya yang terbatas, yang memerlukan investasi jangka panjang yang substansial. Perjanjian AWS memberikan OpenAI akses ke berbagai GPU NVIDIA, termasuk GB200 dan GB300 terbaru, serta kapasitas untuk memanfaatkan jutaan CPU. Infrastruktur ini sangat penting tidak hanya untuk mengembangkan model AI masa depan tetapi juga untuk mengelola permintaan inferensi yang luas dari aplikasi saat ini seperti ChatGPT. Pendiri dan CEO OpenAI, Sam Altman, menekankan bahwa skala teknologi AI canggih memerlukan infrastruktur komputasi yang kuat dan dapat diandalkan.
Pengeluaran signifikan OpenAI mendorong reaksi kompetitif dari penyedia cloud besar. Sementara AWS adalah penyedia layanan cloud terbesar, Microsoft dan Google telah mengalami pertumbuhan cepat dalam pendapatan cloud, sering kali dengan menarik klien AI baru. Kesepakatan AWS adalah upaya strategis untuk mengamankan beban kerja AI kunci dan menunjukkan kemampuannya dalam menangani operasi AI berskala besar, yang dilaporkan mencakup pengelolaan kluster dengan lebih dari 500.000 chip.
AWS tidak hanya menyediakan server standar; ia sedang mengembangkan arsitektur khusus untuk OpenAI, memanfaatkan EC2 UltraServers untuk menghubungkan GPU untuk jaringan latensi rendah yang diperlukan untuk tugas pelatihan yang luas. Matt Garman, CEO AWS, menyatakan bahwa sumber daya komputasi yang luas dan siap pakai menunjukkan kemampuan unik AWS untuk mendukung beban kerja AI OpenAI yang luas.
Namun, istilah 'segera' adalah relatif, karena kapasitas penuh dari perjanjian AI cloud terbaru ini tidak akan terwujud hingga akhir 2026, dengan kemungkinan ekspansi hingga 2027. Garis waktu ini menjadi pengingat bagi eksekutif yang merencanakan inisiatif AI bahwa rantai pasokan perangkat keras itu rumit dan beroperasi pada garis waktu multi-tahun. Oleh karena itu, para pemimpin perusahaan harus mencatat bahwa perdebatan tentang apakah membangun atau membeli infrastruktur AI sebagian besar telah diselesaikan, karena investasi besar OpenAI dalam perangkat keras sewaan menunjukkan bahwa sedikit perusahaan yang dapat atau harus mencoba meniru pendekatan ini. Tren ini kemungkinan akan mendorong pasar menuju platform yang dikelola seperti Amazon Bedrock, Google Vertex AI, atau IBM watsonx, di mana penyedia cloud mengambil risiko infrastruktur.