ML之FE：对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding

芝麻忧伤 2022-09-19 11:26:27  52116

分类专栏：资讯

对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表


 ML之FE：对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表
from sklearn.preprocessing import LabelEncoder
from NDataScience.DataAnalysis import Dict2DfByRow
for col in df.columns:
    print(col,df[col].dtype)
    if df[col].dtype in ['float64', 'int', 'int64']:
        df[col] = pd.to_numeric(df[col])
    else:
         全部字符串化
        df[col] = df[col].apply(str)
        
         编码化
        LbE = LabelEncoder()
        LbE.fit(df[col])
        df[col] = LbE.transform(df[col])
        
        导出映射表：开发逻辑中需要
        mapping_dict = dict(zip(LbE.classes_, range(1, len(LbE.classes_) + 1)))
        mapping_dict = {encode: label for label, encode in enumerate(LbE.classes_)}
        Dict2DfByRow(mapping_dict,mark=col)

文章知识点与官方知识档案匹配，可进一步学习相关知识

Python入门技能树结构化数据分析工具PandasPandas概览123796 人正在系统学习中

网站声明：如果转载，请联系本站管理员。否则一切后果自行承担。

本文链接：https://www.xckfsq.com/news/show.html?id=2053

赞同 0

评论 0 条

ML之FE：对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表daiding

对pandas的dataframe中的类别型字段进行数字编码化(类别型特征数值化)并导出映射表

相关文章

关注我们