目次
記事の要約
- さくらインターネットが生成AI向け実行基盤「さくらの生成AIプラットフォーム」を提供開始
- 複数の基盤モデルから選択可能で、国産サービスのみでの構築も可能
- 京都芸術大学で試験導入開始、高火力とNVIDIA H100 Tensor コア GPUを採用
さくらの生成AIプラットフォーム提供開始
さくらインターネット株式会社は2025年5月14日、フルマネージドの生成AI向け実行基盤「さくらの生成AIプラットフォーム」の提供を開始した。このプラットフォームは、生成AIアプリケーションとLLM、生成AI向けクラウドサービス「高火力」を繋ぐAPIとRAG向けのベクトルデータベースを提供するのだ。
これにより、「高火力」を活用したAIアプリケーションの開発が容易になる。複数の基盤モデルから選択でき、今後国内外問わず連携を拡大し選択肢を増やす予定である。サーバーレス環境で手軽に利用でき、LLMの専門知識がなくても様々な基盤モデルを利用できる点が特徴だ。
京都芸術大学では、株式会社miibo開発の「miibo」とNEC開発の「cotomi」を用いた試験導入を開始している。ユーザーは基盤からアプリケーションまで国産サービスのみで揃えることも可能である。試験導入のフィードバックを元に、サービスの利便性を向上させる予定だ。
さくらの生成AIプラットフォーム概要
項目 | 詳細 |
---|---|
サービス名 | さくらの生成AIプラットフォーム |
提供開始日 | 2025年5月14日 |
提供企業 | さくらインターネット株式会社 |
主な機能 | フルマネージド環境、複数基盤モデル選択、高火力連携、RAG向けベクトルデータベース提供 |
採用GPU | NVIDIA H100 Tensor コア GPU |
試験導入先 | 京都芸術大学 |
試験導入サービス | miibo(株式会社miibo)、cotomi(NEC) |
RAGについて
RAGとはRetrieval Augmented Generationの略で、検索拡張生成を意味する。LLMが回答を生成する際に、関連性の高い情報をデータベースから検索し、その情報を元に回答を生成する技術だ。
- 関連情報の検索
- LLMへの情報提供
- より正確な回答生成
本サービスでは、このRAG向けのベクトルデータベースを提供することで、より精度の高い生成AIアプリケーションの開発を支援する。
さくらの生成AIプラットフォームに関する考察
本サービスは、生成AIの開発を容易にすることで、AI技術の普及促進に大きく貢献するだろう。国産サービスの活用を促進する点も高く評価できる。しかし、利用料金や、基盤モデルの選択肢の豊富さ、セキュリティ対策の堅牢性などは、今後の課題となる可能性がある。
起こりうる問題への対策としては、利用料金体系の明確化、基盤モデルの継続的な追加とアップデート、セキュリティに関する定期的な監査と情報開示などが考えられる。ユーザーからのフィードバックを積極的に取り入れ、サービスを改善していく姿勢が重要だ。
今後追加してほしい機能としては、多言語対応の強化、より高度なカスタマイズ機能、開発者向けの充実したドキュメントなどが挙げられる。ユーザーニーズを的確に捉え、継続的な改善と機能追加によって、より多くの開発者や企業に利用されるプラットフォームとなることを期待する。
参考サイト/関連サイト
- さくらインターネット.「さくらインターネット、フルマネージドの生成AI向け実行基盤「さくらの生成AIプラットフォーム」を提供開始 | さくらインターネット」.https://www.sakura.ad.jp/corporate/information/newsreleases/2025/05/14/1968219471/, (参照 2025-05-15).