RisingWave入門：PostgreSQL互換のストリーム処理データベースを使ってみる【2025年版】

Tasuke Hub管理人

東証プライム市場上場企業エンジニア

情報系修士卒業後、大手IT企業にてフルスタックエンジニアとして活躍。 Webアプリケーション開発からクラウドインフラ構築まで幅広い技術に精通し、複数のプロジェクトでリードエンジニアを担当。技術ブログやオープンソースへの貢献を通じて、日本のIT技術コミュニティに積極的に関わっている。

🎓情報系修士🏢東証プライム上場企業💻フルスタックエンジニア📝技術ブログ執筆者

はじめに：ストリーム処理とは？ RisingWaveが解決する課題

IoTデバイスからのセンサーデータ、金融取引、Webサイトのクリックログなど、現代のアプリケーションは絶え間なくデータを生成し続けています。これらの「データの流れ（ストリーム）」をリアルタイムで処理し、即座にインサイトを得る技術がストリーム処理です。

従来のストリーム処理は、Apache FlinkやApache Spark Streamingのような複雑なフレームワークを必要とし、専門的な知識が求められました。しかし、この分野に新しい波をもたらしているのが、RisingWaveです。

RisingWaveは、クラウドネイティブに設計された分散型SQLストリーム処理データベースです。その最大の特徴は、PostgreSQLと高い互換性を持つSQLを使って、高度なストリーム処理を記述できる点にあります。

RisingWaveが解決する課題:

複雑性の削減: Java/Scalaで複雑なコードを書く代わりに、使い慣れたSQLでストリーム処理を定義できます。
リアルタイム性の実現: データが到着するたびにクエリ結果をインクリメンタルに更新する「マテリアライズドビュー」により、常に最新の分析結果を低レイテンシーで取得できます。
エコシステムの活用: PostgreSQL互換であるため、psqlや各種BIツール、クライアントライブラリなど、既存のPostgreSQLエコシステムをそのまま活用できます。

本記事では、Dockerを使ってRisingWaveをローカルで動かし、簡単なストリーム処理を体験するまでの手順を解説します。

ベストマッチ

最短で課題解決する一冊

この記事の内容と高い親和性が確認できたベストマッチです。早めにチェックしておきましょう。

標準SQL＋データベース入門 ——RDBとDB設計、基本の力［MySQL/PostgreSQL/MariaDB/SQL Server対応］

技術評論社

Amazonで見る

楽天市場で見る

Yahoo!ショッピングで見る

RisingWaveのアーキテクチャ概要

RisingWaveは、いくつかのコンポーネントから構成される分散システムです。

Frontend: SQLクエリのパース、プランニング、最適化を行い、クライアントとの接続（psqlなど）を受け付けます。
Compute Node: 実際のストリーム処理（データのフィルタリング、結合、集計など）を実行します。
Meta Node: システム全体のメタデータ（テーブルスキーマ、ノードの状態など）を管理します。
Object Storage: 状態（マテリアライズドビューの中間結果など）を永続化するために、S3互換のオブジェクトストレージを利用します。

このアーキテクチャにより、各コンポーネントを独立してスケールさせることが可能です。

さらに理解を深める参考書

関連記事と相性の良い実践ガイドです。手元に置いて反復しながら進めてみてください。

SQL 第2版ゼロからはじめるデータベース操作（プログラミング学習シリーズ） [ ミック ]

楽天市場で見る

Yahoo!ショッピングで見る

ステップ1：Docker ComposeによるRisingWaveの起動

RisingWaveは、すべてのコンポーネントを含んだ便利なDocker Composeファイルを提供しています。これを使うと、ローカル環境で簡単にRisingWaveクラスタを起動できます。

# Docker Composeファイルをダウンロード
wget https://github.com/risingwavelabs/risingwave/releases/latest/download/risingwave-compose.yml

# 起動
docker-compose -f risingwave-compose.yml up -d

このコマンドで、Frontend, Compute, Metaの各ノードと、データソースのシミュレータであるdatagen、オブジェクトストレージのminioなどが起動します。

さらに理解を深める参考書

関連記事と相性の良い実践ガイドです。手元に置いて反復しながら進めてみてください。

情報処理教科書プロジェクトマネージャ 2025年版（EXAMPRESS） [ ITのプロ46 ]

楽天市場で見る

Yahoo!ショッピングで見る

ステップ2：`psql`を使った接続とデータソースの定義

RisingWaveはPostgreSQLのプロトコルを話すため、標準的なpsqlクライアントで接続できます。

psql -h localhost -p 4566 -d dev -U root

接続できたら、まず**データソース（Source）**を定義します。これは、KafkaやRedpanda、あるいは単純なTCPストリームなど、外部のデータストリームへの接続情報です。

ここでは、datagenが生成する架空のECサイトの注文データをソースとして定義してみましょう。

CREATE SOURCE orders (
    order_id INT,
    user_id INT,
    product_id INT,
    quantity INT,
    price DECIMAL
) WITH (
    connector = 'datagen',
    datagen.fields.order_id.kind = 'sequence',
    datagen.fields.user_id.kind = 'random',
    datagen.fields.user_id.min = '1',
    datagen.fields.user_id.max = '100',
    datagen.fields.product_id.kind = 'random',
    datagen.fields.product_id.min = '1',
    datagen.fields.product_id.max = '1000',
    datagen.fields.quantity.kind = 'random',
    datagen.fields.quantity.min = '1',
    datagen.fields.quantity.max = '5',
    datagen.fields.price.kind = 'random',
    datagen.fields.price.min = '10',
    datagen.fields.price.max = '1000',
    datagen.rows.per.second = '10'
) FORMAT PLAIN ENCODE JSON;

CREATE SOURCE文は、テーブル定義に似ていますが、データが永続化されるわけではなく、あくまで「流れてくるデータのスキーマ」を定義するものです。

さらに理解を深める参考書

関連記事と相性の良い実践ガイドです。手元に置いて反復しながら進めてみてください。

プロになるためのSpring入門ーーゼロからの開発力養成講座 Software Design plus

Amazonで見る

楽天市場で見る

Yahoo!ショッピングで見る

ステップ3：マテリアライズドビューの作成とリアルタイム集計

RisingWaveの核心機能が**マテリアライズドビュー（Materialized View）**です。これは、クエリの結果を物理的に保存し、ソースデータが更新されるたびに自動的かつインクリメンタルに結果を更新し続けるオブジェクトです。

例えば、「商品ごとの売上高ランキング」をリアルタイムで集計するマテリアライズドビューを作成してみましょう。

CREATE MATERIALIZED VIEW product_sales_ranking AS
SELECT
    product_id,
    SUM(quantity * price) AS total_sales
FROM
    orders
GROUP BY
    product_id
ORDER BY
    total_sales DESC;

このSQLは、ごく普通の集計クエリです。しかし、CREATE MATERIALIZED VIEWとして定義することで、RisingWaveはこのクエリを継続的に実行するストリーム処理ジョブに変換します。ordersソースに新しいデータが流れ込むたびに、product_sales_rankingの内容が自動で更新されます。

さらに理解を深める参考書

関連記事と相性の良い実践ガイドです。手元に置いて反復しながら進めてみてください。

シェルスクリプト＋データベース活用テクニック Bourne　ShellとSQLiteによるDBシ [ 広瀬雄二 ]

楽天市場で見る

Yahoo!ショッピングで見る

ステップ4：データの流れ込みとリアルタイム更新の確認

マテリアライズドビューは、通常のテーブルと同じようにSELECT文でクエリできます。

-- 5秒待ってから実行
SELECT * FROM product_sales_ranking LIMIT 10;

 product_id | total_sales 
------------+-------------
        789 |     14567.89
        123 |     12345.67
        456 |      9876.54
... (結果は実行ごとに異なります)

さらに5秒待ってから同じクエリを再度実行してみてください。

-- 再度実行
SELECT * FROM product_sales_ranking LIMIT 10;

 product_id | total_sales 
------------+-------------
        789 |     18901.23  <-- 更新されている！
        123 |     15678.90  <-- 更新されている！
        456 |     11234.56
...

total_salesの値が変化し、ランキングの順位も入れ替わっているかもしれません。これは、裏側でデータが流れ込み続け、マテリアライズドビューがリアルタイムで更新されている証拠です。バッチ処理のように定期的に集計を再実行する必要はありません。

さらに理解を深める参考書

関連記事と相性の良い実践ガイドです。手元に置いて反復しながら進めてみてください。

詳説データベースストレージエンジンと分散データシステムの仕組み [ Alex Petrov ]

楽天市場で見る

Yahoo!ショッピングで見る

まとめ：SQLでシンプルに始めるリアルタイムデータ分析

本記事では、RisingWaveを使って、PostgreSQL互換のSQLだけでリアルタイムのストリーム処理を実現する基本的な流れを体験しました。

CREATE SOURCE でデータストリームの入り口を定義する。
CREATE MATERIALIZED VIEW で集計や結合などの処理を定義し、結果を自動更新させる。
あとは通常のデータベースのように**SELECT**するだけで、常に最新の分析結果を得られる。

RisingWaveは、これまで専門的なスキルセットが必要だったストリーム処理の世界を、多くのSQLに慣れ親しんだ開発者やデータアナリストに開放します。

リアルタイムのダッシュボード作成、異常検知、オンライン機械学習の特徴量生成など、その応用範囲は非常に広いです。複雑な分散システムを意識することなく、SQLで宣言的にストリーム処理を記述できるRisingWaveは、今後のリアルタイムデータ基盤において重要な選択肢となるでしょう。

さらに理解を深める参考書

関連記事と相性の良い実践ガイドです。手元に置いて反復しながら進めてみてください。

Ansible実践ガイド第4版［基礎編］ impress top gearシリーズ

Amazonで見る

楽天市場で見る

Yahoo!ショッピングで見る

RisingWave入門：PostgreSQL互換のストリーム処理データベースを使ってみる【2025年版】

Tasuke Hub管理人

はじめに：ストリーム処理とは？ RisingWaveが解決する課題

最短で課題解決する一冊

標準SQL＋データベース入門 ——RDBとDB設計、基本の力［MySQL/PostgreSQL/MariaDB/SQL Server対応］

RisingWaveのアーキテクチャ概要

あわせて読みたい

さらに理解を深める参考書

SQL 第2版ゼロからはじめるデータベース操作（プログラミング学習シリーズ） [ ミック ]

ステップ1：Docker ComposeによるRisingWaveの起動

さらに理解を深める参考書

情報処理教科書プロジェクトマネージャ 2025年版（EXAMPRESS） [ ITのプロ46 ]

ステップ2：`psql`を使った接続とデータソースの定義

さらに理解を深める参考書

プロになるためのSpring入門ーーゼロからの開発力養成講座 Software Design plus

関連記事

ステップ3：マテリアライズドビューの作成とリアルタイム集計

さらに理解を深める参考書

シェルスクリプト＋データベース活用テクニック Bourne　ShellとSQLiteによるDBシ [ 広瀬雄二 ]

ステップ4：データの流れ込みとリアルタイム更新の確認

さらに理解を深める参考書

詳説データベースストレージエンジンと分散データシステムの仕組み [ Alex Petrov ]

まとめ：SQLでシンプルに始めるリアルタイムデータ分析

さらに理解を深める参考書

Ansible実践ガイド第4版［基礎編］ impress top gearシリーズ

おすすめ記事

続けて読みたい記事

PostgreSQL遅いクエリ完全解決ガイド【2025年実務トラブルシューティング決定版】

HTTP/REST超入門【2025年版】：メソッド/ステータス/キャッシュの基本

Backstageを使った内部開発者プラットフォーム（IDP）構築入門【2025年版】

JavaScript非同期超入門【2025年版】：Promiseとasync/awaitの基礎と落とし穴

ベクトルデータベース完全ガイド【2025年版】：専用DB vs クラウド vs 既存DB、本当の勝者は？

【2025年版】データコントラクトアーキテクチャ

RisingWave入門：PostgreSQL互換のストリーム処理データベースを使ってみる【2025年版】

Tasuke Hub管理人

はじめに：ストリーム処理とは？ RisingWaveが解決する課題

最短で課題解決する一冊

標準SQL＋データベース入門 ——RDBとDB設計、基本の力［MySQL/PostgreSQL/MariaDB/SQL Server対応］

RisingWaveのアーキテクチャ概要

あわせて読みたい

PostgreSQL遅いクエリ完全解決ガイド【2025年実務トラブルシューティング決定版】

HTTP/REST超入門【2025年版】：メソッド/ステータス/キャッシュの基本

Backstageを使った内部開発者プラットフォーム（IDP）構築入門【2025年版】

JavaScript非同期超入門【2025年版】：Promiseとasync/awaitの基礎と落とし穴

さらに理解を深める参考書

SQL 第2版 ゼロからはじめるデータベース操作 （プログラミング学習シリーズ） [ ミック ]

ステップ1：Docker ComposeによるRisingWaveの起動

さらに理解を深める参考書

情報処理教科書 プロジェクトマネージャ 2025年版 （EXAMPRESS） [ ITのプロ46 ]

ステップ2：psqlを使った接続とデータソースの定義

さらに理解を深める参考書

プロになるためのSpring入門ーーゼロからの開発力養成講座 Software Design plus

関連記事

ベクトルデータベース完全ガイド【2025年版】：専用DB vs クラウド vs 既存DB、本当の勝者は？

【2025年版】データコントラクトアーキテクチャ

【2025年版】サステナブルAIデータセンター戦略

【2025年完全版】Spring Boot入門：初心者から実務レベルまで完全習得ガイド

ステップ3：マテリアライズドビューの作成とリアルタイム集計

さらに理解を深める参考書

シェルスクリプト＋データベース活用テクニック Bourne ShellとSQLiteによるDBシ [ 広瀬雄二 ]

ステップ4：データの流れ込みとリアルタイム更新の確認

さらに理解を深める参考書

詳説 データベース ストレージエンジンと分散データシステムの仕組み [ Alex Petrov ]

まとめ：SQLでシンプルに始めるリアルタイムデータ分析

さらに理解を深める参考書

Ansible実践ガイド 第4版［基礎編］ impress top gearシリーズ

おすすめ記事

PostgreSQL遅いクエリ完全解決ガイド【2025年実務トラブルシューティング決定版】

HTTP/REST超入門【2025年版】：メソッド/ステータス/キャッシュの基本

Backstageを使った内部開発者プラットフォーム（IDP）構築入門【2025年版】

JavaScript非同期超入門【2025年版】：Promiseとasync/awaitの基礎と落とし穴

続けて読みたい記事

PostgreSQL遅いクエリ完全解決ガイド【2025年実務トラブルシューティング決定版】

HTTP/REST超入門【2025年版】：メソッド/ステータス/キャッシュの基本

Backstageを使った内部開発者プラットフォーム（IDP）構築入門【2025年版】

JavaScript非同期超入門【2025年版】：Promiseとasync/awaitの基礎と落とし穴

ベクトルデータベース完全ガイド【2025年版】：専用DB vs クラウド vs 既存DB、本当の勝者は？

【2025年版】データコントラクトアーキテクチャ

SQL 第2版ゼロからはじめるデータベース操作（プログラミング学習シリーズ） [ ミック ]

情報処理教科書プロジェクトマネージャ 2025年版（EXAMPRESS） [ ITのプロ46 ]

ステップ2：`psql`を使った接続とデータソースの定義

シェルスクリプト＋データベース活用テクニック Bourne　ShellとSQLiteによるDBシ [ 広瀬雄二 ]

詳説データベースストレージエンジンと分散データシステムの仕組み [ Alex Petrov ]

Ansible実践ガイド第4版［基礎編］ impress top gearシリーズ