

Content Analysis:关于内容分析法的一切
Content Anlaysis(内容分析法)是学习社会科学的同学们和正在做研究的社科研究者们时常会接触到一种数据分析手段。与我们之前extensively概括过的Thematic Analysis(主题分析法)类似,内容分析法时常是作为定性研究或者定量研究的分析方式出现在人文社科的research中。值得注意的是内容分析法存在的定量的元素,再加上它的种类较多,不仅涉及文字内容分析还涉及到视觉内容分析,就让它与其他的文字分析手段有着许多的不同。今天,小编就带大家一起来深度了解Content Analysis是什么,它的历史和用途,以及怎么样做内容分析法!
Table of Contents
什么是Content Analysis(内容分析):它的历史与在研究中的用途
内容分析法介绍
简单来说,内容分析法(Content Analysis/CA)是一种我们用来分析数据的方法。与thematic analysis(主题分析法)不同,虽然内容分析法大部分时候是用于定性研究中的,它同样可以通过定量的方式去进行。而且有趣的是内容分析法时常还出现在mixed method study(混合方法研究)中。
不管是定量的还是定性的内容分析法,它用于识别记录文字数据中 主要的模式、类别、以及主题。我们在进行内容分析时,需要系统地收集一组文本的数据,或通常情况下已经有了收集好的文本数据,这些文本可以是书面、口头或视觉内容,包括但不限于:
- 书籍、报纸、杂志、以及文章
- 演讲和访谈/采访
- 社交媒体帖子、评论
- 照片、电影、视频
如心理学的研究者和同学们使用的数据通常会是采访的transcription或是研究被试/参与者的自述;学习媒体领域专业(如digital media)的同学们使用的数据可能不单单包括文字,还涵盖了照片、YouTube视频、短视频等类别。这也体现除了内容分析法的类别多样与在社会科学中的广泛应用性。至于具体的内容分析法的类别,我们会在下文中详细介绍。
内容分析可以是定量的(侧重于计数和测量),也可以是定性的(侧重于解释和理解)。无论哪种类型,研究者都会对文本中的单词、主题和概念进行分类或“编码”,然后分析结果。
内容分析法的历史
虽然内容分析法(Content Analysis/缩写为CA)这个英文词汇诞生于20世纪40年代,准确来说是1941年,但它最最初的面貌其实早在17世纪或更早便在世界各地出现,例子包括了欧洲的教堂以及天主教学校专注于文字内容和意义的研究分析,以确保各种媒体发表的内容与神权政府的主张一致。另外一个例子甚至可以包括中国古代文学家、画家对于书籍、诗歌、国画的赏析分析。而现代研究(research)中使用的content analysis则有略微不同的方法和框架。
早在20世纪的上半叶(二战时期的美国),内容分析法就被政府用于对带有纳粹意识形态的宣传材料的检查和规范。而在社会科学领域,包括新闻学、心理学、商科科目、社会学、语言学、人类学等邻域,内容分析法真正地被大量传播且使用是在1950年左右开始。一些标志性的使用CA的研究包括心理学领域学者Allport在1942年发布的名为“The use of personal documents in psychological science”,其中讨论了使用类内容分析法来研究personal document/个人档案(包括如信件、日记、录音、回答等)。还有一个著名例子是心理学家Baldwin在1942年发布的额名为“Personal structure analysis: a statistical method for investigating the single personality”的研究,in which作者讨论了如何将文字内容的频率和其他特点作为统计单元来做量化分析。在1940年-1950年,内容分析法引起了一系列社科界的热烈讨论,而它替代以往传统实验分析方式的功能,在当时有着重大突破性的地位。当然,这里还有许多其他领域的案例,在不多举例的同时,感兴趣的读者可以查阅此文献来详细了解。
1969年,第一本系统性讨论Content Analysis的书出版: 《Content Analysis for the Social Sciences and Humanities》。之后一直到21世纪的今天,关于CA的学术/指导书籍层出不穷。重要的是,作为CA鼻祖的作者Holsti将内容分析定义为“通过客观和系统地识别消息中指定的特征来进行推理的任何技术”,侧面说明了内容分析法的个人独特性。

至此,内容分析法开始被全面使用。据Riffe和Freitag在1997年的报导,光是在新闻学领域,Content Analysis在1971至1995年的使用频率就增加了6倍。
在这里小编需要跟大家分享的是,社会科学家研究、分析文字的手段是从古代就有了的,但是内容分析法的出现相当于是给社科学者提供了一种全新的视角和一共公认的、、广泛运用的、相对来说值得信赖的分析手段。换句话来说,内容分析法出现之前,文字分析手段早已被使用延续了很久了,而CA本身是对它的predecessor的延伸、完善、以及科学化。
内容分析(Content Analysis)的用途
如上所属,社科类研究者主要是使用内容分析法来探究交流内容的目的、信息和影响。他们还可以分析文本的创作者及其受众。内容分析可以用于量化特定单词、短语、主题或概念在一组历史或当代文本中的出现频率,以此得出一些跟研究问题相关的结果和发现。
就对于大学这个环境来说,大家碰到CA的时候常常是因为教授布置的作业需要用到又或是自己的毕业论文/研究需要使用内容分析法来分析数据。作业类的Content Analysis通常以文字分析为主,在qualitative research课程中常出现。而谈及毕业论文(Thesis or Dissertation),Content Analysis的种类则繁多,不仅包括主要的文字内容分析,还涵盖了对图像和视频的分析。
综上所述,内容分析是用来“分析数据,以此得到研究问题答案的手段”。
而提到CA的用途,我们就不得不讨论它的类型,因为不可否认的是不同类型内容分析法—-不管类似于否或是都注重于文字分析—-都有着在某种程度上不同的用途。
内容分析法(Content Analysis)的类型/种类
CA的分类从某种角度来说,可以分为定性/质性的(qualitative)和量化/定量的(quantitative),而两种分类之下有许多细分,而且qualitative和quantitative两种方式可以同时在一个研究里使用。除此之外,CA的分类还可以按照具体每一种的功能和适用的案例情境来分类
下表根据功能和适用的situation来列出了一些常见的内容分析法种类:

如上所示,常见的内容分析法类型包括了以上7种。但是chances are, 9 out of 10 time, 你只会用到四种,包括:conventional analysis、conceptual analysis、relational analysis、和visual analysis。如果你使用的方法在这四种以外,那么恭喜你,你的研究是属于较独特的!话说回来,虽然每一种内容分析法都有着稍显独特的方式,具体怎么去实施它们却都有着非常类似的一个原则,那就是:寻找、分类、归纳、提取。
虽然这几个概念现在听起来可能比较抽象,在接下来小编将使用具体的案例和热身活动来让大家详细了解怎么样去使用内容分析法。After all,怎么使用内容分析法不就是在读的大家想要了解的核心吗?
如何进行内容分析
在说所有接下来的内容之前,小编想强调,不管我们是用什么类型的内容分析,我们都需要先提出一个清晰、直接的研究问题。一个清楚的Research Question(RQ)是所有的前提!
在我们了解这个前提后,感兴趣的读者们可以先进行下面的热身活动:内容分析法小训练。
Content Analysis入门
内容分析法小训练!
注*:大家可以根据自己喜欢的一段文字或专业偏向性来进行此训练(以下两段文字分别为商科和心理学的数据例子)
文字数据1:
“Boost your day with EnergiX! Our all-natural energy drink is packed with essential vitamins and minerals to keep you feeling fresh and focused. Whether you’re at work, the gym, or just need a pick-me-up, EnergiX gives you the fuel you need. Say goodbye to sluggish afternoons and hello to lasting energy. Try EnergiX today and power through your day—naturally!”
文字数据2:
“我没有任何动力做任何事情。我的心力憔悴,一直认为自己是一个失败者且非常恐惧外界对我的评判。我时常觉得自己无法从床上起来,四肢和眼皮都长时间处于疲惫状态。很多时候,我试图通过酒精和香烟来让我渡过最难受的时候或是在无力的时候让它们给予我一点精神,但效果似乎并不是我所预料的那样。4年的精神科就医经历也没有给我任何的改变,因为除了医生日复一日的那句服药,和药物带给我的种种副作用之外,我没有得到任何的东西。也许死亡是我现在唯一的归宿,但是冥冥之中我感觉到我不能因为自己的懦弱和身体精神上的痛苦而选择放弃。”
还记得小编说过的最重要的第一步吗?在此小编讨厌地再次强调一次:确定研究问题(research question)。在此,我们为上面两个文字数据分别设计了两个不同的研究问题:
Research Question (文字数据1):How does energy drinks establish brand image in order to enhance customer engagement?
Research Question (文字数据2):降低精神病患者的生活质量的因素有哪些?提高他们生活质量的因素有哪些?
下面让我们正式来根据这两个研究问题进行内容分析法训练!(此活动大家可以在笔记本或纸张上进行,也可以在电脑上下载这两个pdf,然后用高亮功能进行,并用批注功能进行命名,以及在word或其他文档工具中进行简单的分类)
第一步:根据研究问题,勾出或者高亮出文字数据中你觉得重要的部分。换句话来说,勾出文字数据中你觉得跟研究问题相关的部分;
第二步:用简单的词语或短句来给你勾出的这些部分命名;
第三步:将这些你命名好的部分进行分类,并将不同的分类再一次地命名;
内容分析法小训练答案
文字数据1 答案

文字数据2 答案

在我们简单通过这个小练习了解熟悉了内容分析法的基本要素后,让我们来了解正式的Content Analysis是怎么进行的吧。
注:此种方法为最基本传统的CA操作方法,它的细节可能会随着内容分析法的区别而变化。
Content Analysis怎么进行?
总的来说,content analysis(内容分析法)可以分为大致6个步骤:
- 第一步:选择要分析的内容
- 第二步:确定分析单位和分类
- 第三步:指定编码规则和类别
- 第四步:根据规则将文本编码
- 第五步:分析结果并得出结论
- 第六步:在你的论文/报告/research书面体现中写出结论
STEP 1: 选择要分析的内容
根据研究问题(还是那句话,研究问题是第一步最主要的),选择要分析的文本,并决定:
- 媒介类型(如商业报告、社交媒体帖子、心理学访谈记录)及其具体类别(如企业财报、品牌广告推文、心理咨询会话)
- 包含和排除的标准(如某一行业的市场分析报告、特定品牌的广告宣传内容、某个心理学流派的访谈记录)
- 设定时间范围、地域等参数
例如:
- 商科方向:假设你在研究企业如何通过社交媒体塑造品牌形象,你决定分析2021年至2023年间10家国际品牌在Twitter和Instagram上的官方帖子。由于数据量庞大,你选择每个月随机抽取5篇高互动率的帖子进行分析。
- 媒体/新闻学方向:如果你在研究媒体对AI技术的报道倾向,你可能会选取2020年至2022年间5家主流科技媒体的新闻文章,并只分析其中与“人工智能”“AI伦理”相关的内容。
- 心理学方向:若你的研究关注心理咨询中常见的情绪表达模式,你可能会筛选20篇公开发表的心理咨询访谈记录,并限定访谈对象为18-30岁的年轻人。
STEP 2: 确定分析单位和分类
接下来,我们需要确定分析的层级,包括:
- 编码的单位:如单词、短语、品牌名称、人物特征、情绪表达方式,或者主题和概念的处理方式
- 编码的类别:如具体特征(产品类型、目标市场、情绪倾向)或抽象概念(品牌可信度、新闻报道的立场、心理咨询中的情绪类别),这一步类似于我们之前做的练习中的分类,你需要做的是大概将研究问题可能涉及到的影响因素来分类,然后根据这个分类来慢慢探索是否能概括到所有的数据中在你分析过后得到的分类。
根据主要需要用到CA的专业我们举一些例子:
- 商科方向:你的分析单位是社交媒体广告中的品牌名称以及消费者互动留言,你将其归类为“正面评价”、“负面评价”、“品牌承诺”、“消费者疑虑”等类别,以研究不同品牌如何与消费者互动。
- 媒体/新闻学方向:如一些同学可能会分析新闻文章,编码记者使用的情绪化词汇(如“危险”“突破性进展”)以及新闻立场(如“乐观”“悲观”),并探讨科技报道如何影响公众对AI的看法。
- 心理学方向:如你的研究重点可能是心理咨询访谈中的情绪表达,你会将访谈对象的语言划分为“焦虑”、“愤怒”、“悲伤”、“正面应对”等类别,分析咨询过程中情绪变化的模式。
STEP 3: 制定编码规则
编码是将文本信息归类到预定义的类别中。 尤其是对于概念性分类,明确编码规则至关重要,以确保所有文本的编码保持一致。
示例:
- 商科方向:定义“品牌可信度”类别时,只包括广告中含有“100% 真实用户反馈”、“权威认证”等关键词的内容,而不包括普通的消费者评论。
- 媒体/新闻学方向:在关于AI的新闻报道分析中,规定“乐观”类别需包含词汇如“未来”、“创新突破”,而“悲观”类别包含“风险”、“隐私泄露”等负面表述。
- 心理学方向:设定“焦虑”编码时,必须包括访谈者提到的压力来源(如考试、工作)及身体反应(如“心跳加快”“睡不着”),而不仅仅是提及“我很焦虑”这样的表达。
STEP 4: 根据规则编码文本
编码涉及将意义单元组织到先前定义的类别中。特别是对于更具概念性的类别,明确规定包含和不包含的内容至关重要,以确保所有文本的编码保持一致。
如果有多个研究者参与,编码规则尤为重要。但即使是由研究者本人独立完成编码,记录编码规则也能使研究方法更加透明和可靠。
依照编码规则,逐一分析每篇文本,并记录相关数据。这可以手动完成(事实上,很多期刊论文的内容分析也是用手工完成的),也可以借助软件(如 NVivo(最常用的一种)、Atlas.ti 和 Diction)来加快文本统计和分类的过程。其实编码听起来有点高大上,但是大家可以把它看作为做读书笔记、勾画词语句子、和高亮你觉得跟研究问题最相关的部分。编码并不是一蹴而就的,很多时候我们在第一次编码过后,可能会发现很多我们的编码不适合研究问题,编码太多,或是遗漏了重要的部分,所以说编码是一个循序渐进的过程。甚至有些时候我们在进行下面的步骤之后,还会回来再进行检查并完善、剔除、优化我们的编码。
示例:
- 商科方向:阅读企业社交媒体上的广告帖子,标注所有体现品牌承诺的关键词(如“环保”“科技领先”),并统计消费者的正负面评价。
- 媒体/新闻学方向:分析每篇新闻文章,记录记者对AI的描述方式,并计算正面和负面词汇的比例。
- 心理学方向:阅读心理咨询访谈记录,提取受访者表达情绪的句子,并归类到不同的情绪类别中。
STEP 5: 分析结果并得出结论
完成编码后,我们需要分析数据以寻找模式,并根据研究问题得出结论。这可能涉及:
- 使用统计分析方法寻找关联或趋势
- 讨论研究结果的意义
- 推测文本创作者、社会背景和受众的影响
示例:
- 商科方向:分析结果显示,科技品牌比时尚品牌更倾向于使用“创新”“突破”等正面词汇,而消费者对时尚品牌的负面评价更多集中在“价格过高”上。因此,你得出结论:不同行业的社交媒体营销策略有显著区别。
- 媒体/新闻学方向:研究结果显示,AI相关报道在2020年以正面词汇为主,但到2022年负面词汇增加,表明媒体对AI技术的态度在两年间发生了变化。
- 心理学方向:通过分析心理咨询访谈,你发现年轻人在表达焦虑时更倾向于使用“压力大”“太难了”这样的直接语言,而年长者则更多使用“有点担心”这样的委婉表述,表明年龄对情绪表达方式的影响。
STEP 6: 将分析过程与结论写下来
这一步涉及的细节较多,但是简单来说,你需要将你的分析过程在Methodology(方法论)部分说出,并且尽可能多解释和描述你做出的content analysis的方法。然后在results部分,当然我们需要做的是通过不同部分的方式将你得到的主要主题、发现、定量趋势、和推测与解读给详细写出来。再然后就是我们的conclusion部分,这个部分小编就不在这里多说啦。
结语
在这里,我们对于内容分析法(Content Analysis)的介绍就结束啦。在之后的博客中,我们还会更新其他以定性研究为主导的数据分析方式,例如Discourse Analysis,大家敬请期待!谢谢大家的阅读。
如需Content Analysis代写、内容分析法代写、Content Analysis辅导、内容分析法辅导、定性研究代写、qualitative research代写、NVivo代做等服务,欢迎联系我们!