最下層エンジニアの(´・ω・｀)な落書き

誰かのコピペ

pandasでgroupby.XXX()の結果をdataframeに再投入する

SQLの集計関数結果をテーブルにつっこむ、みたいな

SQLでよくこんな処理をするのではないだろうか。

create table 集計結果 as 
select
    集計キー
   ,count() as カウント
from
    元データ
group by 集計キー

な感じで集計結果をテーブルにつこむ処理。集計の中間テーブルでよくやります。ええやりますとも。

これをpandasのdataframeでやろうとしたらハマった話

df2 = df.groupby(["集計キー"]).count()

ってやると、列名とかがおかしくなり、dataframeとして機能しなくなる。

df2.to_sql()

したいのに

df2 = df.groupby(["集計キー"],as_index=False).count()

ってやるとdf2が再度dataframeで使えますよ、って話。

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

作者: Wes McKinney,小林儀匡,鈴木宏尚,瀬戸山雅人,滝口開資,野上大介
出版社/メーカー: オライリージャパン
発売日: 2013/12/26
メディア: 大型本
この商品を含むブログ (19件) を見る