基于对使用机器学习、元启发式和进化方法的社交媒体分析领域的贡献努力。大多数研究的重点是用户的情感分类、信息检测、时间、聚类和性能分析。因此,社交媒体在现代数据分析中发挥着重要作用,以获得有意义的信息。情感分析可以被定义为一个确定对文本中特定主题的有利或不利意见的过程(Nasukawa & Yi, 2003)。在审查过程的基础上,情感分析的分类方法有三个层次,即方面、文档和句子。文档层面是根据对文档部分的分析,对整个文档进行情感预测。句子层面是对句子部分进行情感分析以提取该特定句子的情感。文档和句子被认为是每个分类的基本信息单位。(Bing, 2015)肯定了这两者之间不存在根本的区别,因为一个句子可以被视为一个简短的文档。不同的是,在方面层面,情感倾向的预测是基于特定主题的方面,而不是基于要分析的单词的字面意思。此外,一些特征已被确定为与信息检测过程相对应,这些特征在表3中提到。它们是:时间--关于位置和发生时间的信息,时间--关于发生时间的信息,社会联系--关于用户的网络和行为的信息,语义--与词或术语的意义有关的信息,情感--与用户的情感有关的信息,以及术语共现--与词或术语的频率有关的信息。从文本中提取信息可以被定义为从文本中提取有用的或预期的数据的过程。关于Hogenboom等人(2011)的讨论,文本中的信息提取被定义为从文本中发现一组经验性的观察结果,它被归纳为三种主要方法。(i) 数据驱动,(ii) 知识驱动,和(iii) 混合驱动。数据驱动的方法不考虑信息的语义方面。这种方法需要很多数据,但需要很少的领域专业知识。不同的是,知识驱动的方法通过使用语言学、词汇学和人类知识来考虑文本的语义方面的问题。这方面需要大量的领域和专业知识,但只需要少量的数据。混合方法是两个方面的结合。
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
加入交流群
请使用微信扫一扫!