《数据分析与知识发现》杂志简介
《数据分析与知识发现》(月刊)创刊于1985年,是中国科学院主管、中国科学院文献情报中心主办的计算机信息管理技术方面的学术性刊物,是国内唯一一份被中国图书馆学会和中国科技情报学会共同推荐的专业技术类核心期刊。刊物设有“数字图书馆”、“知识组织与知识管理”、“情报分析与研究技术”、“应用实践”、“动态”等一系列固定类栏目以及“特邀专栏”、“企业技术之窗”等不定期栏目。
《数据分析与知识发现》内容定位于广泛吸纳计算机科学、数据科学、情报科学以及数字科研、数字教育和数字文化等领域的技术与方法,研究数据驱动的语义计算、内容分析、数据挖掘、知识发现、智能管理和决策支持等方面的技术、方法、系统以及支撑设施、政策与机制等,尤其是聚焦从海量、异构、分布、动态、甚至富媒体数据中挖掘和发现知识以支持研究、管理和决策的理论、方法和技术。
《数据分析与知识发现》办刊宗旨是聚焦各行各业中以大数据为基础,依靠复杂挖掘分析方法,进行知识发现与预测、支持决策分析和政策制定的研究与应用,致力于提供理论指导、技术支持和最佳实践。
《数据分析与知识发现》栏目设置
数学图书馆、知识组织与知识管理、情报分析与研究、应用实践、动态、特邀专栏、金融证券管理、企业信息管理技术
《数据分析与知识发现》杂志荣誉
CSSCI 南大核心期刊(中文社会科学引文索引)(含扩展版)万方收录(中)上海图书馆馆藏国家图书馆馆藏知网收录(中)维普收录(中)中国期刊全文数据库(CJFD)中国核心期刊遴选数据库
2018年《数据分析与知识发现》杂志08期投稿论文目录:
基于t-SNE降维的科学基金资助项目可视化方法研究陈挺;李国鹏;王小梅;
基于BRFSS数据库应用人工神经网络构建儿童哮喘预测模型马晓宇;张晗;赵玉虹;
新一代知识问答平台中提问者付费意愿的影响因素探究赵宇翔;刘周颖;宋士杰;
基于预警平台大数据的事件旅游客流时空分布研究王玲;代前进;吴晓隽;
面向微博短文本分类的文本向量化方法比较研究李心蕾;王昊;刘小敏;邓三鸿;
基于LDA和AdaBoost多特征组合的微博情感分析曾子明;杨倩雯;
基于领域本体的产品网络口碑信息多层次细粒度情感挖掘何有世;何述芳;
跨设备搜索中设备转移前后查询式语义变化研究吴丹;陆柳杏;
等待感知对于移动信息产品用户满意度的影响研究——以数字小说书架为例马艳阳;刘玉磊;徐伯初;支锦亦;
收录论文:面向微博短文本分类的文本向量化方法比较研究
【摘要】:【目的】利用Word2Vec和Sent2Vec算法生成新浪微博的文本的向量化表示形式,以期在文本分类时获得较低的计算成本和较高的分类效果。【方法】使用文本中词的0-1矩阵进行分类,将分类效果作为基准线;采用Word2Vec算法生成词向量并用不同方式合成句子的向量表示,进行文本分类,并与基准线进行对比;利用Sent2Vec算法直接生成句子向量进行分类,综合评价3种方法的优缺点。【结果】研究显示使用Word2Vec算法和Sent2Vec算法能够极大程度上压缩文本特征,对比于使用所有3万多个词作为特征,Word2Vec算法和Sent2Vec算法将特征数压缩在1 000以内。在分类准确率方面,Word2Vec算法的分类准确率比基准线低约3%,准确率为75.14%。Sent2Vec算法的分类效果远不如其他两种方法,准确率只有63.08%。【局限】由于语料有限,Word2Vec算法在计算词向量时可能缺少足够的语义信息,导致词向量的准确性不高,而Sent2Vec算法在中文文本语境下生成句向量的分类结果较差。【结论】Word2Vec算法更适用大规模语料文本分类,在文本量较少时应使用词为特征分类。
相关科技期刊推荐