您现在的位置是:主页 > news > 自己做个网站教程/看b站视频软件下载安装手机

自己做个网站教程/看b站视频软件下载安装手机

admin2025/6/1 19:47:03news

简介自己做个网站教程,看b站视频软件下载安装手机,网站左下角留言板html,找工程承包01 描述性统计量 | 描述集中趋势 均值:即平均值,其为一组数据的总和除以数据的个数。 中位数:将一组数据升序排列,位于该组数据最中间位置的值,就是中位数。如果数据个数为偶数,则取中间两个数值的均值。 …

自己做个网站教程,看b站视频软件下载安装手机,网站左下角留言板html,找工程承包01 描述性统计量 | 描述集中趋势 均值:即平均值,其为一组数据的总和除以数据的个数。 中位数:将一组数据升序排列,位于该组数据最中间位置的值,就是中位数。如果数据个数为偶数,则取中间两个数值的均值。 …

01 描述性统计量 | 描述集中趋势

均值:即平均值,其为一组数据的总和除以数据的个数。
中位数:将一组数据升序排列,位于该组数据最中间位置的值,就是中位数。如果数据个数为偶数,则取中间两个数值的均值。
众数:一组数据中出现次数最多的值。

关于三者,说明如下:
  • 数值变量通常使用均值与中值表示集中趋势。
  • 类别变量通常使用众数表示集中趋势。
  • 在正态分布下,三者是相同的。在偏态分布下,三者会有所不同。
  • 均值使用所有的数据进行计算,因此容易受到极端值的影响。
  • 中位数与众数不受极端值的影响,因此会相对稳定。
  • 众数在一组数据中可能不是唯一的。
三者的关系,如下图

在这里插入图片描述

代码
from sklearn.datasets import load_iris
import numpy as np
from scipy import statsiris = load_iris()
data = iris.data
# 求均值
print(np.mean(data[:,0]))
# 求中位数
print(np.median(data[:,0]))
# 求众数 
print(stats.mode(data[:,0])[0][0])
输出

在这里插入图片描述

import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']    #指定默认字体
plt.rcParams['axes.unicode_minus'] = False    #解决保存图像时负号’-’显示为方块的问题  sns.distplot(data[:,0])
plt.axvline(mean,ls='-',color='r',label="均值")
plt.axvline(median,ls='-',color='g',label="中位数")
plt.axvline(mode,ls='-',color='b',label="众数")
plt.legend()

在这里插入图片描述