抖音短视频培训机构真实吗(抖音女主播直播睡觉)

程度可以发生从量变到质变的跳跃,用户在移动短视频平台中的历史活跃行为对信息质量和可靠性有真实一定影响,进而影响到移动培训机构短视频的传播效果。根据本文选定的研究方向,并结合移动短视频行业发展状况,本文决定选择抖音移动培训短视频平台作为研究的数据来源。真实抖音平台在移动短视频行业具有典型性和代表性,在国内排名最靠前、用户数量最大。抖音上带火了很多产品,如小猪佩奇手表、兔子耳朵等等,抖音平真实台在现实中具有较真实大的影响力,商业模式相比于其他平台也比较成熟。

从该平台获取的数据有较高的代表性和研究价值,选择抖音短视频平台为数据源所得研究结果可培训机构以对短视频行业的发展起到更好的借鉴作用,因此,本文选取抖音移动短视频APP作为本文研究的数据源。抖音移动短视频APP作为典型的UGC内容平台,用户在APP上产生了大量的数据,这些数据主要包括用培训机构户上传的移动短视频数据,用户在观看移动短视频过程中进行互动产生的数据以及用户自身的数据。据报道,抖音的日活早已上亿,每日新增的短视频数量可达到数十万条,具体的某一条移动短视频记录、用户记录还分别由不真实同的属性组成,比如,移动短视频记录则包括移动短视频上传时间、真实话题、标题等,用户记录还包括用户年龄、性别、音乐类型、粉丝数、作品数等属性。根据第3章中提出的理论研究模型,同时结合抖音短视频APP具体情况,本文对相关数据及字段进行了归纳和说明。表4-2是用户信息的字段说明表,主要包括移动短视频发布者的用户编号、昵称、性别、身份认证、粉丝数、作品数、动态数、喜欢数等字段,并对相关字段进行了了详细的说明。本文通过编写网络爬虫程序收集本次研究所需数据,并将数据存储至SQLite数据库中,网络爬虫程序是真实依据视频到用户再到视频的顺序进行,采用无登陆采集的方式进行数据采集。

APP爬虫在实现难度上比网页爬虫高,在网页环境真实下,可以通过地址栏获得地址,但是在移动环境下,无法通过地址栏获得地址。所以,本文需要使用抓包工具-36-起的所有请求都能够转发到服务器上,服务器的响应接着通过Fiddler转发到APP请求数据、设置断点、调试Web应用、修改请求的数据,还可以修改服务器返回的数据。抖音APP为了保护数据,将请求数据的接口做了加真实密处理,没有被加密处理的接口,在发起请求的时候获取不到数据,本文对于抖音的加密入口限制进行了解析。抖音平台有反爬虫机制,在多次尝试之后发现,在短时间内如果同一IP地址多培训机构次访问用户主页信息会被抖音APP禁止访问,本文通过设置不同的客户端代理等,通过随机切换不同的模拟IP等访问抖音客户端,从而顺利绕过抖音APP的反爬获得数据。本文通过构造post请求访问抖音推荐的视频,之后抖音会推送一个JSON数据包,接着通过对JSON数据包进行解析,获取移动短视频用户的id等参数信息,接着构造移动短视频用户主页和移动短视频用户视频的地址,然后分别发送请求,获取用户和视频的数据包,接培训机构着对这些数据包进行解析,最终,获得较为全面的移动短视频用户信息和移动短视频信息真实,如图4-1所真实示。

由于不同经纬度推送的视频基本不同,但每次只能得到六个视频的包,所以本文通过切换经纬度完成持续不断的数据抓取。本文将爬虫得到的信息存入SQLite数据库中,该数据库中设有两张表,一个是用户信息表,一个是视真实频信息表,用户信息表里用户id是主键,如果采集的推荐视频里的用户存在于用户培训机构信息表中,就会被过滤掉,不会再构造对这个用户的主页信息和视频信息的请求,从而起到了过滤的作用。图4-1爬虫流程图月25日为研究期,在此期间展开第一步数据采集工作。本文运用网络爬真实虫程序陆续从抖音APP上随机抓取移动短视频用户信息总计条,抓取视频信息总计条。在抓取到的用户记录的基础上,提取出用户id信息以供后续数据抓取所用。第二步,本文选取了培训机构第二次采集时间段真实,以2019年04月12日至2019年04月26日为研究期,在此期间展开第二步数据采集工作。

本文的第二步数真实据采集工作以2019年02月17日至2019真实年02月25日之间采集到的个用户的id为基础,每天将个用户的用户信真实息与所有视频信息抓真实取一遍,总共持续15天培训机构。

相关文章

用户评论

*

*

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。