Python之pandas:数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化之详细攻略
目录
数据类型变换之object、category、bool、int32、int64、float64以及数据类型标准化
推荐文章
Python之pandas:在pandas中创建category类型数据的几种方法之详细攻略
ML之FE:将dataframe中的数据类型进行标准化
在pandas中,如果某个字段下,数据类型不一致导致整个字段类型不相同,可以进行字段类型转换!,在pandas中,进行数据类型转换非常简单,只需要使用astype函数即可!
object类型(python中) | category类型(pandas中特有) | |
简介 | python是面向对象的语言。在python里面,一切皆为对象。 在python中,
|
|
属性 | 具有object类型数据的基本属性。 |
|
转换 | df["col"].astype(‘category‘) |
- import pandas as pd
- import numpy as np
-
- contents={"name": ['Bob', 'LiSa', 'Mary', 'Alan'],
- "ID": [1, 2, ' ', None], 输出 NaN
- "age": [np.nan, 28, 38 , '' ], 输出
- "age02": [14, 26, 24 , 6],
- "born": [pd.NaT, pd.Timestamp("1990-01-01"), pd.Timestamp("1980-01-01"), ''], 输出 NaT
- "sex": ['男', '女', '女', None,], 输出 None
- "hobbey":['打篮球', '打羽毛球', '打乒乓球', '',], 输出
- "money":[200.0, 240.0, 290.0, 300.0], 输出
- "weight":[140.5, 120.8, 169.4, 155.6], 输出
- "test01":[1, 2.123456789, 3.123456781011126, 4.123456789109999], 输出
- "test02":[1, 2.123456789, 3.123456781011126, 4.123456789109999], 输出
- }
- data_frame = pd.DataFrame(contents)
-
-
- print('Init-------------------------------')
- print(data_frame.dtypes)
- print(data_frame)
-
-
- 将dataframe格式中的数据类型转为object数据类型
- data_frame['test02'] = data_frame['test02'].astype('object') 关键字bool,'object'、'category'、str
- data_frame['test02'] = data_frame['test02'].apply(str)
- data_frame.to_excel("data_demo.xls")
-
- print('after astype-------------------------------')
- print(data_frame.dtypes)
- print(data_frame)
- data_frame_temp=data_frame.copy()
-
-
-
-
- ML之FE:将dataframe中的数据类型进行标准化
- print('after Categorical-------------------------------')
- data_frame=cols2DfCatAndNum(data_frame)
- print(data_frame.dtypes)
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
加入交流群
请使用微信扫一扫!