汽车媒体信息架构分类设计以及实现思路.doc
第1页共7页汽车媒体信息架构分类设计以及实现思路一、信息架构分类方式根据我对汽车厂商的理解,目前可能对产品存在需求的部门,按照其职能可以划分为市场(品牌)、公关(新闻办、舆情)、销售(渠道)、服务(售前、售后)、财务(金融)、产品(设计、研发)。从对客户的需求理解和客户实际的预算来考虑,市场目前定位的主要目标受众为市场和公关。其他职能部门目前阶段只能算做潜在的需求,没有被充分挖掘,也没有明确的预算,市场开拓难度风险比较大,所以不做为这个阶段市场的主要受众目标。在汽车媒体信息架构分析文档中,我把媒体的资讯信息分为新闻、调研分析、市场行情、汽车金融、质量投诉、评测导购、用车经验、娱乐八卦、互动,以下为详细的信息结构表信息类别信息模块新闻新车上市、行业动态、政策法规、交通信息调研分析评论分析、人物访谈、调研报告、销售数据市场行情产品报价、促销降价、二手车、用品配件、经销商动态汽车金融车贷、保险理赔质量投诉召回、质量门事件、消费者投诉评测导购试驾、静态评测、车型推荐对比、导购用车经验维修保养、驾驶技巧、装饰改装、专业知识娱乐八卦自驾游、汽车运动、车模美女互动问答、口碑、博客、微博客、论坛、点评以上的信息模块,根据我对客户需求的理解,总结了以下需求关系表第2页共7页信息模块市场公关销售财务服务新车资讯√X√XX行业动态√√√XX政策法规√√√XX交通信息X√XXX评论分析√√XXX人物访谈√√√XX调研报告√XXXX销售数据√X√√X产品报价XX√XX促销降价XX√XX二手车XX√XX用品配件XXXXX经销商动态√X√XX车贷√X√√√保险理赔√√√√√召回√√√√√质量门事件√√√X√消费者投诉√√√X√试驾√X√XX静态评测√X√XX车型推荐对比√X√XX第3页共7页导购√X√XX维修保养XXXX√驾驶技巧XXXXX装饰改装XXXXX专业知识XXXXX自驾游XXXXX汽车运动√XXXX车模美女XXXXX在互动模块中,博客的信息基本可以按照以上的分类方式来划分,问答、口碑、点评、论坛、微博客的信息主要产生于消费者,所以需根据各自的特点来确定分类方式,我认为目前阶段客户对互动信息的主要关注点可以分为敏感话题(重大负面事件、消费者投诉、竞争对手攻击)发现、软性营销信息传播、品牌(产品)口碑调研。其中口碑、点评、论坛信息可以挖掘出消费者对汽车品牌产品的观点,根据产品特性、情感倾向性进行分类,为客户制定营销、公关等活动的策略提供及时、全面、客观的决策依据。以下是我对互动信息模块的分类和与客户的需求关系表信息模块市场公关销售财务服务新车资讯√X√XX行业动态√√√XX车友评车√√√XX质量投诉√√√X√维修保养XXXX√精彩作业√√√X√第4页共7页自驾游记XXXXX车友聚会√√√XX评测导购√X√XX车市行情√X√√X八卦花边XXXXX由于互动信息所涉及的话题比较杂,所以上表的分类并未涵盖所有话题,待以后进一步分析确定。我认为产品的设计除了考虑以功能模块来定制外,还应考虑个性化的信息模块设计,例如市场部更关心宏观层面的行业资讯和品牌产品的口碑调研数据,而公关部更关心微观层面的敏感话题和负面信息,产品应可以根据其不同的需求来灵活配置相应的信息模块和产品功能,或者干脆针对于不同职能部门推出细分的定制化版本(品牌管理版、公关监测版、口碑调研版),产品定价策略也应考虑把信息模块因素考虑进去。二、文本分类技术的应用和训练语料库的整理策略1)文本分类类别的设计需要充分考虑客户的需求和评估实现的成本,因为训练语料库建立成本(主要是时间成本)很高,而且分类算法的效果直接由语料库的质量决定,所以在整理语料库的工作开始之前,应该为每种分类做明确的定义和统一的判断标准。如果通过人都很难界定的分类,即使整理出来语料训练效果也不会好,这种情况应该重新考虑分类设计。2)使用特征关键词匹配的方法就可以达到不错分类效果的类别,无需使用分类算法以及整理训练语料库,直接通过特征关键词来进行分类。特征关键词一定要具备明确的分类属性,不能选择明显含有歧义的词。因为标题的内容基本概括了文章的大意,所以可以考虑直接使用标题是否匹配特征关键词做为分类依据。3)无法通过关键词匹配的方法准确分类的类别,就需要整理分类训练语料集,用于概率分类算法的第5页共7页训练和测试,语料环境的实验结果准确率达到80以上,生产环境的准确率达到70以上,才可以考虑做为正式产品的功能。4)每次分类训练需要采用标题、标题正文两种方式来进行实验,生产环境采用哪种方式由实际的结果来决定。5)分类算法准确率的高低,需要从分类算法和语料库两个层面来理解。每次实践后都需要充分总结经验,更深入的理解分类效果与算法、语料库之间的关联规律,提高对分类技术的运用能力,提升文本分类的效率和准确率。6)语料库需要定期更新一批新的数据,尽量利用爬虫程序进行自动收集,以保证分类算法能够适应新的网络语言环境。下图是我构思的文本分类技术的应用思路,当然具体的实现细节还需要和相关人员讨论第6页共7页(文本分类技术的应用策略)目前我已经完成了一部分语料库的收集工作,以下为统计数据信息类别文章量新车上市4590市场动态7967调研分析917营销报告145交通信息4891人物访谈2772第7页共7页政策动态2456行情3552试驾评测3162导购2999维修保养3223用品配件3520专业知识1386汽车运动1074质量投诉3751贷款保险807