博客
关于我
数据挖掘于分析实例解析——数据特征分析
阅读量:317 次
发布时间:2019-03-04

本文共 1713 字,大约阅读时间需要 5 分钟。

数据的特征分析:

定量的分析:选择数组和组宽做频率分析是主要的问题。一般按照以下步骤进行;1求解极差2 决定组距和数组3决定分布点4列出频率分布表 5绘制频率直方图。

定性行的分析:

# -*- coding: utf-8 -*-import pandas as pdcatering_sale = './data/catering_sale.xls'data = pd.read_excel(catering_sale, index_col = u'日期')print(data.describe(),'\n')print('total: ',len(data))data = data[(data[u'销量']>400) & (data[u'销量']<5000)]statistics = data.describe()#保存的是基本的统计量 最大值 最小值 常见参数s = statisticss.loc['range'] = s.loc['max'] - s.loc['min']#求解极差s.loc['var'] = s.loc['std'] / s.loc['mean']#求解变异系数s.loc['dis'] = s.loc['75%'] - s.loc['25%']##求解四分位间距 print(statistics)

结果:

count   200.000000mean   2755.214700std     751.029772min      22.00000025%            NaN50%            NaN75%            NaNmax    9106.440000 total:  201                销量count   195.000000mean   2744.595385std     424.739407min     865.00000025%    2460.60000050%    2655.90000075%    3023.200000max    4065.200000range  3200.200000var       0.154755dis     562.600000
# -*- coding: utf-8 -*-# 帕累托分析import pandas as pdimport matplotlib.pyplot as plt# 显示中文字体plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号# pd读取文件dish_profit = './data/catering_dish_profit.xls'data = pd.read_excel(dish_profit, index_col=u'菜品名')data = data[u'盈利'].copy()data.sort_index(ascending=False)plt.figure()data.plot(kind='bar')  # 柱状图plt.ylabel(u'盈利(元)')p = 1.0 * data.cumsum() / data.sum()p.plot(color='r', secondary_y=True, style='-o', linewidth=2)  # 线# 添加注释,即85%处的标记。这里包括了指定箭头样式。plt.annotate(format(p[6], '.4%'), \             xy=(6, p[6]), \             xytext=(6 * 0.9, p[6] * 0.9), \             arrowprops=dict(arrowstyle="->", connectionstyle="arc3,rad=.2"))plt.ylabel(u'盈利(比例)')plt.show()

转载地址:http://jujh.baihongyu.com/

你可能感兴趣的文章
错误: 找不到或无法加载主类 org.gradle.wrapper.GradleWrapperMain
查看>>
android带气泡的第三方选项卡
查看>>
好玩的editText
查看>>
Material Design之RippleDrawable详解
查看>>
自动安装服务2
查看>>
edittext弹出键盘或者隐藏键盘
查看>>
viewpager的setOffscreenPageLimit方法有什么作用
查看>>
基类去掉标题栏
查看>>
使用DatagramSocket发送、接收数据(Socket之UDP套接字)
查看>>
android用视频当做背景
查看>>
Android6.0权限之超级无敌坑
查看>>
android 用action拦截打电话界面
查看>>
Android设置某个窗口常亮和最大亮度
查看>>
【已解决】Android Studio下,gradle project sync failed 错误
查看>>
打包命名
查看>>
Android SDK 与API版本对应关系
查看>>
实现谣传QQ中的手段——“1像素页面保活”
查看>>
Android UI效果篇-(3)用属性动画实现收缩菜单
查看>>
android中getLocationInWindow 和 getLocationOnScreen的区别
查看>>
Android反编译-揭秘猎豹设置默认浏览器逻辑
查看>>