きっかけ
ジェンダー平等を意識した発言をしようとしても、無意識のうちにジェンダーバイアスを含む言葉を使ってしまうことがあると感じています。
SDGsの目標5「ジェンダー平等」の達成に向けて、個人が自身の発言に含まれる潜在的なバイアスに気付き、改善するきっかけを提供するために、このプロジェクトを発案しました。
提供する機能
「ジェンダーバイアス検出」は、音声データからジェンダーバイアスを含む発言を検出し、その内容をレポートするWebアプリです。
音声ファイルのアップロードやリアルタイムの音声解析を通じて、ユーザーの発言に潜むバイアスを明らかにし、意識的に改善するためのサポートを提供します。
音声録音・レポート生成機能
ブラウザ上で録音した音声から、Geminiが自動的にジェンダーバイアスを解析し、レポートを生成します。
音声ファイルアップロード・レポート生成機能
音声ファイルをアップロードすることでも、レポートを生成することができます。
リアルタイム音声解析機能
実験的な機能として、リアルタイムで発言を解析し、ジェンダーバイアスを検知する機能も提供しています。
どのように構築したか
フロントエンド
React/TypeScriptを使用して構築しています。スタイリングにはshadcn/uiを使用しています。
ヒーローイメージはImageFXで生成しています。
ブラウザ上での録音にはMediaRecorder APIを使用しています。
リアルタイム音声解析はMediaRecorder APIとSpeechRecognition APIを組み合わせての実装を試みています。
バックエンド
FastAPIを使用してフロントエンドからのリクエストを処理し、Vertex AIおよびGemini APIを使用してジェンダーバイアスの検出を行いました。
音声ファイルは事前の文字起こしは行わず、直接Geminiで処理をしています。
認証
Auth0を導入してアプリケーションを保護しています。
インフラ
Google App Engine および Google Cloud Run でアプリケーションをホストしています。
工夫したこと
スタイリングにshadcn/uiを使用したことで、スタイリングに費やす時間を大幅に削減できました。
ヒーローイメージや紹介動画に使用する画像をImageFXで生成することで、意図した画像を即座に入手できました。
Geminiの音声認識の精度が非常に高いことを利用して、事前の文字起こし処理をせずとも精度の高いレポートを生成することができました。
Auth0を導入することで、スケーラビリティを備えたアプリケーションセキュリティを実現できました。
Google App Engine および Google Cloud Run でアプリケーションをホストすることで、デプロイ時間の短縮や費用の削減、高いスケーラビリティを手間をかけずに実現できました。
抱えている課題
リアルタイム音声解析機能が常に意図した動作になるようにフロントエンド・バックエンド双方における更なる改良が必要です。
また、App Engine と Cloud Run 間の通信の閉域化によるセキュリティの向上など、インフラ面でも改善の余地があると認識しています。
ジェンダーバイアス検出の今後
・過去のレポートを確認できるような履歴機能 ・ブラウザ上での音声再生 ・リアルタイムでの通知や分析 といった、ユーザーにとって便利な機能拡張ができるとよいと考えています。 また、生成AIによる音声解析はジェンダーバイアス検出に留まらず、例えばハラスメント検出など他の領域への応用も視野に入れています。
Built With
- auth0
- fastapi
- gemini-api
- google-app-engine
- google-cloud-run
- python
- react
- typescript
- vertex-ai


Log in or sign up for Devpost to join the conversation.