前回は「グラフ化」でデータを見える化しました。
今回は、Pythonで 平均や合計などの簡単な統計計算 をやってみます。
統計を使うと、データの傾向がさらにわかりやすくなります。
1. 平均・合計を計算してみよう
まずは基本の計算です。
scores = [80, 55, 70, 90, 65]
# 合計
total = sum(scores)
print("合計:", total)
# 平均
average = sum(scores) / len(scores)
print("平均:", average)
sum()
で合計len()
でデータの個数- 平均は合計 ÷ データの数
2. max・minも簡単に
データの中で 一番大きい値 や 一番小さい値 も簡単にわかります。
print("最高点:", max(scores))
print("最低点:", min(scores))
3. pandasで表形式データを計算
CSVなどでデータがある場合は、pandas
が便利です。
import pandas as pd
df = pd.read_csv("students.csv")
# 平均点
print("平均点:", df["点数"].mean())
# 最高点
print("最高点:", df["点数"].max())
# 最低点
print("最低点:", df["点数"].min())
df["点数"]
は列のデータを取得mean()
,max()
,min()
で統計計算
4. 応用例:成績の判定と統計
for s in df["名前"]:
print(s, "さんの点数は", df[df["名前"]==s]["点数"].values[0])
print("平均点:", df["点数"].mean())
- 名前ごとの点数を出力しながら平均点も表示
- グラフと組み合わせると、データ分析っぽいことが簡単に体験できる
まとめ
- Pythonで簡単に 合計・平均・最大・最小 を計算できる
- pandasを使うとCSVなどの表データもそのまま統計計算可能
- データの傾向を数字やグラフで確認できるようになる
次回は 「Pythonでちょっとした実践プログラムを作ってみよう」 をやって、ここまでの知識をまとめて応用します。
コメント