Daya Komputasi Menjadi Model Bisnis Baru Gelombang "Peleburan" Model Besar Mungkin Akan Memudar
Belakangan ini, pelatihan model besar telah memicu persaingan sengit untuk sumber daya komputasi berkinerja tinggi. Beberapa perusahaan bahkan rela membayar mahal untuk membeli chip GPU dari Nvidia. Namun, tren "meramu" ini mungkin hanya fenomena sementara, penyedia daya komputasi perlu bersiap-siap dan mempersiapkan diri untuk kembalinya pasar yang lebih rasional.
Dari informasi yang diperoleh, saat ini di dalam negeri sudah ada lebih dari 100 model besar dengan skala mencapai 10 miliar parameter. Namun, permintaan GPU high-end melebihi pasokan, menyebabkan biaya daya komputasi yang tinggi, menjadi salah satu tantangan utama yang dihadapi industri. Harga GPU Nvidia A100 pernah diperdagangkan hingga 200-300 ribu yuan, dan sewa bulanan untuk satu server A100 juga mencapai 50-70 ribu yuan. Meskipun demikian, GPU high-end tetap sulit didapat.
Menghadapi situasi sulit ini, perusahaan sedang mencari berbagai strategi untuk menghadapinya:
Menggunakan data berkualitas lebih tinggi untuk meningkatkan efisiensi pelatihan
Meningkatkan kapasitas infrastruktur, untuk mencapai operasi jangka panjang yang stabil dari kluster GPU skala besar
Mengoptimalkan penjadwalan sumber daya, meningkatkan Daya Komputasi GPU
Meningkatkan arsitektur jaringan, mengurangi keterlambatan pelatihan
Menggunakan arsitektur superkomputer untuk menggantikan arsitektur cloud tradisional
Menggunakan platform GPU domestik sebagai pengganti produk Nvidia
Namun, solusi ini memiliki ambang teknologi yang relatif tinggi bagi perusahaan umum. Oleh karena itu, banyak tim algoritma memilih penyedia layanan daya komputasi profesional untuk mendukung pelatihan model besar.
Faktanya, Daya Komputasi telah berkembang menjadi model layanan baru. Layanan Daya Komputasi mewujudkan output Daya Komputasi yang heterogen melalui teknologi komputasi baru, dan terintegrasi dengan teknologi seperti cloud computing, big data, dan AI. Ini tidak hanya mencakup Daya Komputasi, tetapi juga mencakup pengemasan sumber daya seperti penyimpanan dan jaringan, yang disampaikan kepada pengguna dalam bentuk API dan lainnya.
Dalam rantai industri daya komputasi, perusahaan hulu menyediakan sumber daya perangkat keras dasar, perusahaan tengah bertanggung jawab atas produksi dan penjadwalan daya komputasi, sedangkan perusahaan hilir adalah pengguna akhir. Pembagian kerja ini memungkinkan pengguna untuk lebih mudah mendapatkan daya komputasi yang diperlukan, tanpa perlu membangun infrastruktur dasar yang kompleks.
Saat ini, penagihan berdasarkan penggunaan dan paket tahunan/bulanan adalah model penagihan layanan daya komputasi yang utama. Di masa depan, industri juga akan mendorong "integrasi komputasi dan jaringan", untuk mewujudkan penjadwalan yang fleksibel lintas arsitektur, lintas wilayah, dan lintas penyedia layanan.
Data dari Kementerian Perindustrian dan Teknologi Informasi menunjukkan, pada tahun 2022, total skala daya komputasi China mencapai 180EFLOPS, menempati urutan kedua di dunia, dan skala industri daya komputasi telah mencapai 1,8 triliun yuan. Kebangkitan model besar semakin mempercepat perkembangan industri daya komputasi.
Namun, para pelaku industri percaya bahwa gelombang "perebutan chip" saat ini mungkin hanya fenomena sementara. Dalam jangka panjang, masalah kekurangan Daya Komputasi pada akhirnya akan teratasi. Tim yang benar-benar terlibat dalam penelitian jangka panjang tidak akan membeli secara buta, melainkan sabar menunggu pasar kembali ke rasionalitas.
Bagi penyedia layanan daya komputasi, yang terpenting adalah bersiap-siap untuk perubahan setelah pasar mendingin. Seiring dengan meredanya tren model besar, layanan daya komputasi sebagai model bisnis baru akan mengalami perkembangan yang lebih rasional dan berkelanjutan.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Daya Komputasi layanan menjadi peluang bisnis baru, pelatihan model besar mungkin akan cenderung lebih rasional.
Daya Komputasi Menjadi Model Bisnis Baru Gelombang "Peleburan" Model Besar Mungkin Akan Memudar
Belakangan ini, pelatihan model besar telah memicu persaingan sengit untuk sumber daya komputasi berkinerja tinggi. Beberapa perusahaan bahkan rela membayar mahal untuk membeli chip GPU dari Nvidia. Namun, tren "meramu" ini mungkin hanya fenomena sementara, penyedia daya komputasi perlu bersiap-siap dan mempersiapkan diri untuk kembalinya pasar yang lebih rasional.
Dari informasi yang diperoleh, saat ini di dalam negeri sudah ada lebih dari 100 model besar dengan skala mencapai 10 miliar parameter. Namun, permintaan GPU high-end melebihi pasokan, menyebabkan biaya daya komputasi yang tinggi, menjadi salah satu tantangan utama yang dihadapi industri. Harga GPU Nvidia A100 pernah diperdagangkan hingga 200-300 ribu yuan, dan sewa bulanan untuk satu server A100 juga mencapai 50-70 ribu yuan. Meskipun demikian, GPU high-end tetap sulit didapat.
Menghadapi situasi sulit ini, perusahaan sedang mencari berbagai strategi untuk menghadapinya:
Namun, solusi ini memiliki ambang teknologi yang relatif tinggi bagi perusahaan umum. Oleh karena itu, banyak tim algoritma memilih penyedia layanan daya komputasi profesional untuk mendukung pelatihan model besar.
Faktanya, Daya Komputasi telah berkembang menjadi model layanan baru. Layanan Daya Komputasi mewujudkan output Daya Komputasi yang heterogen melalui teknologi komputasi baru, dan terintegrasi dengan teknologi seperti cloud computing, big data, dan AI. Ini tidak hanya mencakup Daya Komputasi, tetapi juga mencakup pengemasan sumber daya seperti penyimpanan dan jaringan, yang disampaikan kepada pengguna dalam bentuk API dan lainnya.
Dalam rantai industri daya komputasi, perusahaan hulu menyediakan sumber daya perangkat keras dasar, perusahaan tengah bertanggung jawab atas produksi dan penjadwalan daya komputasi, sedangkan perusahaan hilir adalah pengguna akhir. Pembagian kerja ini memungkinkan pengguna untuk lebih mudah mendapatkan daya komputasi yang diperlukan, tanpa perlu membangun infrastruktur dasar yang kompleks.
Saat ini, penagihan berdasarkan penggunaan dan paket tahunan/bulanan adalah model penagihan layanan daya komputasi yang utama. Di masa depan, industri juga akan mendorong "integrasi komputasi dan jaringan", untuk mewujudkan penjadwalan yang fleksibel lintas arsitektur, lintas wilayah, dan lintas penyedia layanan.
Data dari Kementerian Perindustrian dan Teknologi Informasi menunjukkan, pada tahun 2022, total skala daya komputasi China mencapai 180EFLOPS, menempati urutan kedua di dunia, dan skala industri daya komputasi telah mencapai 1,8 triliun yuan. Kebangkitan model besar semakin mempercepat perkembangan industri daya komputasi.
Namun, para pelaku industri percaya bahwa gelombang "perebutan chip" saat ini mungkin hanya fenomena sementara. Dalam jangka panjang, masalah kekurangan Daya Komputasi pada akhirnya akan teratasi. Tim yang benar-benar terlibat dalam penelitian jangka panjang tidak akan membeli secara buta, melainkan sabar menunggu pasar kembali ke rasionalitas.
Bagi penyedia layanan daya komputasi, yang terpenting adalah bersiap-siap untuk perubahan setelah pasar mendingin. Seiring dengan meredanya tren model besar, layanan daya komputasi sebagai model bisnis baru akan mengalami perkembangan yang lebih rasional dan berkelanjutan.