Benchmark Archive

2025/02/04

サーバースペック

cpu: INTEL(R) XEON(R) GOLD 6526Y (32cores)
main memory: 512GB
cpufreq-governor: powersave

以下のグラフはTPC-Hベンチマークに含まれる22種類のクエリでの4つのデータフレームライブラリ（pandas, DuckDB, Polars, FireDucks）の比較を示しています．縦軸はpandasに対して何倍速いか（実行時間が短いか）を対数軸で示しています．1より大きい場合はpandasより速いことを示しています．データサイズを表すScale Factorは10（約10GB程度のデータセット）で，ファイルIO以外の時間（RUN_IO_TYPE=skip, 上図）とファイルIOを含んだ時間（RUN_IO_TYPE=parquet, 下図）を測定しています．

22クエリの平均でのpandasからの速度向上:

	Excluding I/O	Including I/O
DuckDB	63x	43x
Polars	39x	32x
FireDucks	78x	38x

I/O以外の時間でのpandasからの速度向上

polars-tpch-sf10-skip

I/Oを含んだ時間でのpandasからの速度向上

polars-tpch-sf10-parquet

ベンチマークコードについて

このベンチマークはpolars/tpchをベースにしています．polars/tpchはpolars向けには全22クエリがありますが，pandas向けには一部しかありませんでしたので，今回はFireDucks開発チームでpandasを用いてクエリを実装し，それをimport hookを用いてFireDucksで動かしました． Polarsとその他のライブラリのapple-to-appleの比較となるように，これらのクエリはできる限りpolarsのクエリと同じ実装としてあります． PolarsとpandasはAPIが違いますのでコードは完全には一致しませんが，merge/join, filter, groupbyと言ったコストがかかる処理の数は可能な限り同じにしてあります．

2024-12-06

TPC-Hを用いたデータフレームライブラリの比較

ベンチマークのソースコード

以下のグラフはTPC-Hベンチマークに含まれる22種類のクエリでの4つのデータフレームライブラリ（pandas, modin, polars, fireducks）の比較を示しています．縦軸はpandasに対して何倍速いか（実行時間が短いか）を対数軸で示しています．1より大きい場合はpandasより速いことを示しています．データサイズを表すScale Factorは10（約10GB程度のデータセット）で，ファイルIO以外の時間を測定しています．

22クエリの平均でのpandasからの速度向上は，Modinは1.0倍，Polarsは57倍，FireDucksは125倍でした．

polars-tpch-sf10

利用した各ライブラリのバージョンは以下になります（計測時の最新版）．

pandas: 2.2.3
Modin: 0.32.0
Polars: 1.6.0
FireDucks: 1.1.2

サーバースペック (AWS EC2 m7i.8xlarge)

CPU: Intel(R) Xeon(R) Platinum 8488C (32cores)
メインメモリ: 128GB

ベンチマークコードについて

2024-09-09

ベンチマークのソースコード

22クエリの平均でのpandasからの速度向上は，Modinは0.89倍，Polarsは39倍，FireDucksは50倍でした．

polars-tpch-sf10

利用した各ライブラリのバージョンは以下になります（計測時の最新版）．

pandas: 2.2.2
Modin: 0.30.0
Polars: 0.20.29
FireDucks: 0.11.4

サーバースペック

CPU: Intel(R) Xeon(R) Gold 5317 CPU @ 3.00GHz x 2sockets （合計48HWスレッド）
メインメモリ: 256GB

次にScalar Factor(sf)を10, 20, 50にしてデータサイズを大きくした場合にPolarsとFireDucksの比較結果を示します．縦軸はPolarsに対してFireDucksが何倍速いかを示しています．平均ではFireDucksが1.3倍(sf=10), 1.3倍(sf=20), 1.5倍(sf=50)高速となっています．

polars-tpch

2024-06-05

ベンチマークのソースコード

22クエリの平均でのpandasからの速度向上は，Modinは1.2倍，Polarsは16倍，FireDucksは27倍でした．

polars-tpch-sf10

利用した各ライブラリのバージョンは以下になります（計測時の最新版）．

pandas: 2.2.2
Modin: 0.30.0
Polars: 0.20.29
FireDucks: 0.11.4

サーバースペック

CPU: Intel(R) Xeon(R) Gold 5317 CPU @ 3.00GHz x 2sockets （合計48HWスレッド）
メインメモリ: 256GB

次にScalar Factor(sf)を10, 20, 50にしてデータサイズを大きくした場合にPolarsとFireDucksの比較結果を示します．縦軸はPolarsに対してFireDucksが何倍速いかを示しています．平均ではFireDucksが1.7倍(sf=10), 1.7倍(sf=20), 1.8倍(sf=50)高速となっています．

polars-tpch

ベンチマークコードについて

このベンチマークはpolars/tpchをベースにしています．polars/tpchはpolars向けには全22クエリがありますが，pandasやmodin向けには一部しかありませんでしたので，今回はFireDucks開発チームでpandasを用いてクエリを実装し，それをimport hookを用いてFireDucksで動かしました．これらのクエリは，pandasやmodinで動かす際にも利用しました．

注意我々のpandas/modin/pandas版のクエリは、クエリの結果が期待される結果に等しいという単純なルールで実装されています。しかし、Polarsのクエリは、ここで説明されているように、異なるルールで実装されているようです。したがって、このベンチマークはリンゴ対リンゴではないと言えるでしょう。

2024-02-06

サーバースペック

CPU: Intel(R) Xeon(R) Gold 5317 CPU @ 3.00GHz x 2sockets （合計48HWスレッド）
メインメモリ: 256GB

TPC-Hを用いたデータフレームライブラリの比較

ベンチマークのソースコード

22クエリの平均でのpandasからの速度向上は，Modinは1.3倍，Polarsは13倍，FireDucksは18倍でした．

polars-tpch-sf10

利用した各ライブラリのバージョンは以下になります（計測時の最新版）．

pandas: 2.2.0
Modin: 0.26.1
Polars: 0.20.7
FireDucks: 0.9.8

次にScalar Factor(sf)を10, 20, 50にしてデータサイズを大きくした場合にPolarsとFireDucksの比較結果を示します．縦軸はPolarsに対してFireDucksが何倍速いかを示しています．平均ではFireDucksが1.3倍(sf=10), 1.3倍(sf=20), 1.7倍(sf=50)高速となっています．

polars-tpch

ベンチマークコードについて

各クエリのソースコードはこちらで公開しています．