ITシステム

DeepSeek利用上の課題と対策について


DeepSeekは2025年1月20日、推論能力を飛躍的に高めた大規模言語モデル「DeepSeek-R1」を発表しました。そしてその性能については、米国のオープンAIが2024年9月にリリースした最新AIモデル「o1」(性能は最下段の参考を参照ください)に匹敵する、と主張し話題になっています。
DeepSeekは米オープンAIや米グーグルのAIモデルに匹敵する性能をもつ対話型生成AIを低コスト(約8億円)で開発、低性能なAI半導体を駆使してChatGPTと同等なものを実現したため、高価なAI用GPUを提供していた米国の大手半導体メーカーNVIDIAの株価が1月24日(金)から1月27日(月)にかけて約20%安($148→$118)となり、該社の時価総額はこの間に約7000億ドル(約108兆円)減少しました。7000億ドルというと日本企業の時価総額1位のトヨタ自動車(約2700億)ドルの約2.6倍というとんでもない金額です。

しかしながら画期的と思われるDeepSeekは、中国製ということもあって「安かろう悪かろう」で結局コスト増となる可能性もあり、利活用にあたっては種々注意しなければなりません。

以下にその課題と利用上の留意点について述べたいと思います。

■DeepSeekの課題

1. 品質と信頼性の問題

幻覚(ハルシネーション): 事実ではない情報をもっともらしく生成することがある。
情報の正確性: 学習データの範囲に依存し、最新の情報や専門的な知識が不足することがある。
一貫性の欠如: 長文の生成や複数回の対話において、内容が矛盾することがある。

2. 倫理的・法的問題

著作権問題: 学習データに含まれるコンテンツが著作権を侵害する可能性がある。
偏見(バイアス): 学習データに含まれる社会的な偏見がAIの出力にも反映されることがある。
悪用のリスク: フェイクニュースの作成や、詐欺、ディープフェイクなどの悪用が懸念される。

3. データセキュリティとプライバシーの懸念

個人情報の漏洩: AIが学習データから個人情報を推測・再現する可能性がある。
データの管理: AIモデルのトレーニングに使用されたデータが適切に管理されているか不透明な場合がある。特に、利用者のデータが中国のサーバーに保存される可能性があり、情報の取り扱いには慎重な対応が求められます。

4. 検閲や情報操作のリスク

中国企業が開発したモデルであるため、情報の検閲や偏向のリスクが懸念されています。特に政治的なトピックに関して、特定の視点や情報が制限される可能性があります。

5. 技術的制約と性能のトレードオフ

DeepSeekは、限られたハードウェアリソースで効率的なモデルを開発していますが、その過程で精度や性能に影響を及ぼす可能性があります。特にメモリ使用量の削減や計算速度の向上を図る中で、モデルの精度が犠牲になるリスクがあります。

6. クリエイティブ領域への影響

アーティストやライターへの影響: 生成AIの普及により、クリエイターの仕事が奪われる可能性があります。
オリジナリティの問題: AIが既存のデータをもとに生成するため、本当に独創的な作品を生み出せるのか疑問です。

■DeepSeek利用上の留意点

前述の課題についてはChatGPTの課題とも重なる部分が多いのですが、なんといってもDeepSeekは中国製なので、特に中国当局の作意には注意が必要となります。
利活用にあたってはデータセキュリティとプライバシー保護の観点、ならびに検閲や情報操作におけるリスクを十分考慮する必要があります。

1. データセキュリティとプライバシー保護

DeepSeekは中国のサーバーを利用している可能性があり、データが中国国内に保存されることが考えられます。従って、越境移転などの場合において中国の個人情報保護法(PIPL:Personal Information Protection Law of China)やサイバーセキュリティ法の適用を受ける可能性があります。日本の個人情報保護法やEUのGDPR(一般データ保護規則)との整合性も慎重に検討する必要があります。

2. 入出力データの利用と保持

入力したデータや生成された出力が、DeepSeekのAIモデル品質向上のために利用される可能性があります。機密情報や個人情報を入力する際には、これらのデータが第三者に共有されるリスクを考慮し、適切な同意や契約保護(DPA:Data Processing Agreementの締結等)を行うことが重要です。

3. 検閲や政治的バイアスの考慮

DeepSeekの応答には、中国の法律や社会主義の価値観が影響します。(例:天安門事件に係る質問には無応答など)
このように特定の政治的・社会的トピックに関する応答に偏りが見られる場合があるため、利用者は政治的リスクを考慮する必要があります。

従来のChatGPTにおいても技術開発・法律・倫理の観点から未解決な問題が多々ありますが、それらに加えてDeepSeekの利用や導入に際しては、データの取り扱いやモデルの信頼性、当局による検閲、倫理的側面について十分な検討と対策が必要となります。

 

(参考)OpenAIの新モデル「o1」の性能概要(OpenAIの発表より)

・物理学、化学、生物学の難しいタスクで博士課程の学生と同等のパフォーマンスを発揮
・数学とコーディング能力でも優れている
・国際数学オリンピック予選試験で83%のスコアを獲得(以前は13%)
・コーディングコンテスト「Codeforces」で上位11%(89パーセンタイル)に到達
・初期モデルであり、Web閲覧やファイル・画像のアップロードなどの機能はまだ未対応
・複雑な推論タスクでの大きな進歩を示しており、AIの新たなレベルを象徴





最近の投稿

ご挨拶

事務所代表 八津川直伸

ご挨拶

昨今のデジタル人材不足は深刻なものとなって参りました。当事務所ではITシステム導入に係る、プロジェクトマネジメント(情報システムの調達・構築・運用・保守)支援や、リスク対策(サイバーセキュリティ、プライバシー保護対策)等に関するご相談もお受けしておりますので、お問合せフォームからお気軽にご連絡ください。

業務のご案内
アーカイブ
カテゴリー
お問い合わせ
2025年1月
 12345
6789101112
13141516171819
20212223242526
2728293031