特征预处理_无量钢化-APISpace

特征预处理_无量钢化

无量钢化分为

1.归一化 2.标准化主要是为了使数据可以有一个统一的比重

常见的无量纲化处理方法主要有极值化、标准化（最常用）、均值化和标准差化方法。

归一化

定义

通过对原始数据的转化把数据映射到[0,1)之间

公式为:

1列 90: X· = 1 X`` = 1

2列 2: X` = 0 X`` = 0

API:

数据计算

from sklearn.datasets import load_irisimport pandas as pdfrom sklearn.preprocessing import MaxAbsScalerdef dataset_demo(): # 归一化 #1.获取数据 data = pd.read_csv("dating.txt") data = data.ilic[:, :3] print(data) #2.实例化转化器类 transfor = MaxAbsScaler() #3.调用fit_transform() data_new = transfor.fit_transform(data) print(data_new) return Noneif __name__ == "__main__": dataset_demo()

问题

由于归一化的最大值和最小值是变化的,而且受到其他点的影响,所以只使用于小场景

标准化

定义

通过对原始数据进行变化为均值为0,方差为1的范围

公式

对于归一化来说：如果出现异常点的话,会影响最大值和最小值,那么结果会发生变化对于标准化来说：如果出现异常值的话,由于具有一定数据量,少量的异常点对于均值没有影响,方差改变小

API

数据计算

from sklearn.datasets import load_irisimport pandas as pdfrom sklearn.preprocessing import MaxAbsScalerfrom sklearn.preprocessing import StandardScalerdef dataset_demo(): # 归一化 #1.获取数据 data = pd.read_csv("dating.txt") data = data.ilic[:, :3] print(data) #2.实例化转化器类 transfor = StandardScaler() #3.调用fit_transform() data_new = transfor.fit_transform(data) print(data_new) return Noneif __name__ == "__main__": dataset_demo()

总结

标准化适用于大场景

标签：API

java系统找不到指定文件怎么解决

284 2022-09-27

特征预处理_无量钢化

java系统找不到指定文件怎么解决

ajax怎么读取本地文件

C++怎么实现iocp进行SOCKET通信

推荐文章

api接口有哪几种分类及功能

什么是API接口?API接口简单介绍

短信API接口概述，短信API接口的优势

7款快递物流的物流查询API工具，物流快递查询API接口怎么对接？

企业四要素: 了解企业经营成功的关键

什么是语音验证码?,语音验证码平台有哪些

全国工商查询系统怎么查企业名录

哪些平台提供实名认证的接口？

PHP如何调用API接口?

如何使用百度天气预报API接口?

最近发表

热评文章

数据接口api（数据接口API开发平台）

数据开放接口api（数据服务api开发）

Python爬虫教程：爬取酷狗音乐（python爬取

hbuilder怎么更改字体大小和颜色

直播平台api接口 - 构建卓越的直播平台

实时股票数据api接口（股票实时行情api接口）