きっかけ

ジェンダー平等を意識した発言をしようとしても、無意識のうちにジェンダーバイアスを含む言葉を使ってしまうことがあると感じています。
SDGsの目標5「ジェンダー平等」の達成に向けて、個人が自身の発言に含まれる潜在的なバイアスに気付き、改善するきっかけを提供するために、このプロジェクトを発案しました。

提供する機能

「ジェンダーバイアス検出」は、音声データからジェンダーバイアスを含む発言を検出し、その内容をレポートするWebアプリです。
音声ファイルのアップロードやリアルタイムの音声解析を通じて、ユーザーの発言に潜むバイアスを明らかにし、意識的に改善するためのサポートを提供します。

音声録音・レポート生成機能

ブラウザ上で録音した音声から、Geminiが自動的にジェンダーバイアスを解析し、レポートを生成します。

音声ファイルアップロード・レポート生成機能

音声ファイルをアップロードすることでも、レポートを生成することができます。

リアルタイム音声解析機能

実験的な機能として、リアルタイムで発言を解析し、ジェンダーバイアスを検知する機能も提供しています。

どのように構築したか

フロントエンド

React/TypeScriptを使用して構築しています。スタイリングにはshadcn/uiを使用しています。
ヒーローイメージはImageFXで生成しています。
ブラウザ上での録音にはMediaRecorder APIを使用しています。
リアルタイム音声解析はMediaRecorder APIとSpeechRecognition APIを組み合わせての実装を試みています。

バックエンド

FastAPIを使用してフロントエンドからのリクエストを処理し、Vertex AIおよびGemini APIを使用してジェンダーバイアスの検出を行いました。
音声ファイルは事前の文字起こしは行わず、直接Geminiで処理をしています。

認証

Auth0を導入してアプリケーションを保護しています。

インフラ

Google App Engine および Google Cloud Run でアプリケーションをホストしています。

工夫したこと

スタイリングにshadcn/uiを使用したことで、スタイリングに費やす時間を大幅に削減できました。
ヒーローイメージや紹介動画に使用する画像をImageFXで生成することで、意図した画像を即座に入手できました。 Geminiの音声認識の精度が非常に高いことを利用して、事前の文字起こし処理をせずとも精度の高いレポートを生成することができました。
Auth0を導入することで、スケーラビリティを備えたアプリケーションセキュリティを実現できました。
Google App Engine および Google Cloud Run でアプリケーションをホストすることで、デプロイ時間の短縮や費用の削減、高いスケーラビリティを手間をかけずに実現できました。