【笔记】Python3数据分析

前言

Python3数据分析学习笔记

生成随机数

  • 利用列表生成式生成随机数

  • 返回<num>个随机数的列表

1
2
3
import random

result = [random.randrange(<num_start>, <num_end>) for _ in range(<num>)]
  • 返回外层有<num_2>个随机数列表,内层有<num_1>个随机数,的嵌套列表
1
2
3
import random

result = [[random.randrange(<num_start>, <num_end>) for _ in range(<num_1>)] for _ in range(<num_2>)]

求平均数

1
2
3
4
5
6
7
nums = []

# 求平均数
def mean(nums):
return sum(nums) / len(nums)

result = mean(nums)

求最大值

1
2
3
nums = []

result = max(nums)

求最小值

1
2
3
nums = []

result = min(nums)

求标准差

  1. 计算方差

$$
\sigma^2=\frac{1}{n}\sum_{i=1}^{n}{(x_i-\bar{x})^2}
$$

1
2
3
4
5
6
7
8
nums = []

# 计算方差
def variance(nums):
mean_value = mean(nums)
return mean([(num - mean_value) ** 2 for num in nums])

variance(nums)
  1. 计算标准差

$$
\sigma = \sqrt{ \sigma^2=\frac{1}{n}\sum_{i=1}^{n}{(x_i-\bar{x})^2} }
$$

1
2
3
4
5
6
7
8
nums = []

# 计算标准差
def standard_deviation(nums):
variance_value = variance(nums)
return variance_value ** 0.5

standard_deviation(nums)

利用NumPy处理数据

传送门

利用Matplotlib绘制图表

传送门

利用Seaborn绘制图表

传送门

利用Pandas处理数据并绘制图表

传送门

归一化

  • 把数据缩放到0到1之间

线性归一化(标准化)

$$
X_i’ = \frac {X_{i} - X_{min}} {X_{max} - X_{min}}
$$

零均值归一化(中心化)

$$
X’ = \frac {X_{i} - \mu} {\sigma}
$$

完成

参考文献

哔哩哔哩——骆昊jackfrued