提供データ詳細

Sagebase（政治ベース）は、日本の政治議論を構造化データとして提供するオープンデータプラットフォームです。本ページでは、提供しているデータの詳細をご紹介します。

提供データ一覧

1. 議会議論データ

国会および全国1,966の地方議会における議論を、構造化データとして提供します。

2. 議案賛否データ（準備中）

議案の詳細情報と、その議案に対する議員・政党の賛否記録を提供予定です。

議会議論データ

データの概要

**「誰が、いつ、何を発言したのか」**を、国会および全国すべての地方議会で記録しています。

単なる発言の羅列ではなく、議論の文脈を保持した構造化データとして提供することで、政治家の発言を正しく理解できる形式になっています。

提供するデータ項目

発言者情報

発言者名: 議事録に記載された発言者の氏名
政治家との紐付け: 実際の政治家プロフィールとの関連付け
所属政党（発言時点）: その発言が行われた時点での所属政党
役職・肩書き: 発言時の役職（例：〇〇委員長、〇〇大臣）

発言内容

発言全文: 議事録に記録された発言内容の全文
発言日時: いつ発言されたのか（会議の開催日時）
会議情報: どの議会のどの会議での発言か
- 議会名（例：衆議院、東京都議会、横浜市議会）
- 会議名（例：本会議、予算委員会）
- 会議の種類（定例会、臨時会など）

議論の文脈情報

政治ベースでは、発言単位ではなく、議論全体の流れを把握できるデータ構造を提供しています。

前後の発言: ある発言の前後にどのような発言があったのか
議論の流れ: 質疑応答の一連の流れ
発言順序: 会議内での発言の順番

これにより、発言を文脈から切り離さずに理解することができます。

データのカバレッジ

国会: 衆議院・参議院のすべての会議
都道府県議会: 47都道府県すべて
市区町村議会: 1,918市区町村すべて
合計: 1,966の議会

データの特徴

1. 時系列での追跡が可能

特定の政治家について、過去の発言を時系列で追跡できます。

活用例:

「〇〇議員は過去に環境問題についてどのような発言をしてきたか」
「△△大臣の答弁の変化を時系列で確認したい」

2. 所属政党の変遷も記録

政治家が政党を移籍した場合でも、その発言時点での所属政党を記録しています。

活用例:

「A党に所属していた時期の発言と、B党に移籍した後の発言を比較したい」
「政党別の政策スタンスの違いを分析したい」

3. 議論全体の文脈を保持

発言を単独で切り出すのではなく、前後の発言との関係性を保持しています。

活用例:

「質問に対してどのような答弁がなされたのか」
「議論がどのように展開されたのか」
「ある発言が、どのような文脈で語られたのか」

議案賛否データ（準備中）

データの概要

議案の詳細情報と、誰が（どの政党が）その議案に賛成・反対したのかを記録したデータを提供予定です。

提供予定のデータ項目

議案の詳細情報

議案名: 議案のタイトル
議案内容: 議案の概要・詳細
提出者: 誰が提出した議案か（議員名、政党名）
審議経過: どのような審議を経たか
採決日: いつ採決が行われたのか
採決結果: 可決/否決

議員ごとの賛否記録

議員名: 賛否を表明した議員の氏名
所属政党（採決時点）: 採決時の所属政党
賛否: 賛成/反対/棄権/欠席
会議情報: どの会議での採決だったか

政党ごとの賛否傾向

政党別の賛否: 各政党がどのように賛否を表明したか
党議拘束の有無: 党として統一した賛否だったか
賛否の分かれた議案: 党内で意見が分かれた案件

データの特徴

1. 議案の全体像を把握

議案そのものの情報（内容、提出者、審議経過、可決/否決）を包括的に提供します。

活用例:

「この法案はどのような内容で、誰が提出し、可決されたのか」
「環境関連の議案がどれだけ提出され、何が可決されているか」

2. 議員個人の賛否履歴を追跡

特定の議員について、過去の賛否記録を一覧で確認できます。

活用例:

「〇〇議員は環境関連の議案にどう賛否してきたか」
「選挙公約と実際の賛否の一致度を検証したい」

3. 政党間の違いを可視化

同じ議案に対して、各政党がどのように賛否を表明したかを比較できます。

活用例:

「A党とB党は同じ議案に対してどう賛否したか」
「各政党の政策スタンスの違いを定量的に分析したい」

4. 議案ごとの詳細分析が可能

特定の議案について、誰が賛成し、誰が反対したのかを詳細に分析できます。

活用例:

「この重要法案に対する各議員の立場はどうだったか」
「党議拘束がかかっていない議案での賛否傾向を調べたい」

データへのアクセス方法

政治ベースのデータは、主要なデータプラットフォームで公開データセットとして提供します。

BigQuery Analytics Hub

Google Cloud Platform（GCP）のBigQuery Analytics Hubで、公開データセットとして提供します。

メリット:
- SQLで直接クエリ可能
- 大規模データの高速処理
- GCPの他サービスとの連携が容易
- 無料で利用可能（クエリ実行コストのみ）

Snowflake Marketplace

Snowflake Marketplaceで、公開データセットとして提供します。

メリット:
- SQLで直接クエリ可能
- Snowflakeユーザーは即座にアクセス可能
- データのコピー不要（Zero-Copy Cloning）
- エンタープライズグレードのセキュリティ

提供時期

現在、データセットの整備とプラットフォームへの公開準備を進めています。公開開始時期については、本ページで順次お知らせいたします。

お問い合わせ

データの利用方法や詳細については、お問い合わせページからご連絡ください。