作成パターン

  • 空のデータフレームを作って、レコードを追加していくパターン
    • 新たに空のデータフレームを作成
    • 既存データフレームから空のデータフレームを作成
  • 行だけ確保した空のDataFrameを作って、後からカラムを加えていくパターン

空のデータフレームを作って、レコードを追加していくパターン

  • 新たに空のデータフレームを作成
In [1]:
import pandas as pd

cols = ['col1', 'col2']
df = pd.DataFrame(index=[], columns=cols)

record = pd.Series(['hoge', 'fuga'], index=df.columns)

for _ in range(5):
    df = df.append(record, ignore_index=True)

print(df)
   col1  col2
0  hoge  fuga
1  hoge  fuga
2  hoge  fuga
3  hoge  fuga
4  hoge  fuga
  • 既存データフレームから空のデータフレームを作成
In [2]:
df_blank = df.iloc[0:0]
print(df_blank)
df1 = df_blank.append(df)
print(df1)
Empty DataFrame
Columns: [col1, col2]
Index: []
   col1  col2
0  hoge  fuga
1  hoge  fuga
2  hoge  fuga
3  hoge  fuga
4  hoge  fuga

行だけ確保した空のDataFrameを作って、後からカラムを加えていくパターン

In [3]:
import pandas as pd
import numpy as np

# 元になるDataFrame
df = pd.DataFrame(np.random.random([100, 3]), columns=['foo', 'bar', 'baz'])
print(df.head())
print(len(df))
        foo       bar       baz
0  0.162949  0.610590  0.872259
1  0.732015  0.969791  0.022720
2  0.433584  0.245143  0.152153
3  0.857225  0.132263  0.565164
4  0.739305  0.010368  0.730865
100
  • 上記DataFrameをベースに、行だけ確保した空のDataFrameを作成
In [4]:
# カラムがないindexだけ設定されているDataFrameを作成
df_new = pd.DataFrame(index=df.index, columns=[])
print(df_new)
Empty DataFrame
Columns: []
Index: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

[100 rows x 0 columns]
  • カラムを1列ずつ計算して追加
In [5]:
# これにdfを整形したカラムを追加してみる
df_new['hoge'] = df.foo ** 2
print(df_new.head())
       hoge
0  0.026552
1  0.535846
2  0.187995
3  0.734834
4  0.546572