手机浏览器扫描二维码访问
作为一名合格的科研工作者,谢与非首先开始做文献收集工作。
Sci-Hub是用不了了,KI上的文献也不算很多,于是谢与非只好从最基础的做起——先筛选知名小说网站和APP。
不多时就进入到了着名的网文论坛,从中筛选出基本符合要求的平台若干。
然后再细分,哪些网站以霸总小白文见长,哪些受众比较多样化。
接着呢,就是科研狗们最喜欢的收集数据阶段。
谢与非花了两个晚上,研究了各类榜单的排名和更新依据,从论坛里搜集了大量资料,甚至搞明白了几大平台女频的各种打榜暗箱操作。
于是她——开始看小说了?
不,蠢蠢欲动想要写个刷票小程序和网站的算法较量一下,看能不能被识破。
但是理智告诉她,做研究要不忘初心,总结霸总的行为规律才是首要任务,于是又回归到了霸总文本身。
开始的时候,谢与非做了个Excel表,里面列了各个网站排名前十的霸总文,并且按照简介和名字做了分类。
通过阅读大量的书评,扫文号和论坛讨论贴可知,霸总文只是一个大项目,里面还分有不同的小类与流派。
根据题材可以分为重生,穿越,现实,古代等等,穿越下面还有,等小类。
根据风格还可以分为「甜宠型」,「强迫型」,「型」,「契约情人型」等等。分析平台的榜单排名可知,目前「虐恋型」已经过时,「甜宠型」和「火葬场型」正在当红。
表列到这里,谢与非发现单纯的表格已经不能满足她了,这种复杂的分类需要一个坐标系。
于是画起了横轴和纵轴。
除了文章风格,作为霸总文灵魂的「霸总」当然也需要分类。
什么型霸总,粗暴型霸总,外冷内热型霸总,智商极高型霸总,反正也是需要一个坐标系来画明白的。
画着画着图她的思维又开始奔逸了,像霸总文这种具有高度同质性并且特徵明显的小说,是不是可以先收集大量数据建立一个语料库,然后再写一个算法让AI自动出产霸总文,只要输入想要的属性标签,然后就可以自动从语料库里摘取句子生成语段。同理可证那些打脸文丶丶文都可以一样产出。
小贴士:如果觉得不错,记得收藏网址或推荐给朋友哦~拜托啦(.)
:||
夜路行人 苗疆少年的小情蛊 欲拒还迎后男主精分了 影后娘娘升职记 瑞雪临 山青卷白云:女翻译与王维 多米诺爱情 星际第一符籙机甲师 缘来很甜 [原神] 原初之母竟是我自己 [历史同人] 天幕剧透后秦始皇手握封神榜 夜间飞行 死对头老公出轨观察日记 御厨大人她有新派料理[美食] 请认真搞笑 在年代文离婚后的幸福生活 鼻炎Beta生活手册 八零漂亮后妈,嫁个厂长养崽崽 绿茶女配的前男友们 七十年代创业忙
大佬心,废材身!当了一辈子卦术天才的江楚没想到有朝一日会成为灵意混沌的废材!毁灭吧,她累了。直到,有一天她能看到人头顶的小字姓名张三,近日运势三日后与隔壁村寡妇偷情被寡妇儿子打死于是,名满天下,青史留芳。实力再强也仍然因为没有后台而成为弃子?与其去看上位者的脸色不如自己成为上位者!开宗立派!我本为尊!江...
...
一个关于留守儿童的故事。一个关于留守儿童的成长故事。又名。...
陈帅重生了,以前的他是个好吃懒做的躺平街溜子。赚钱养家,却成为漂亮媳妇的责任!闺蜜抓紧离婚吧,我一个外人都看不下去了,都是你付出什么时候是个头呀!老丈人你也不出去听听,别人怎么说你的,五大三粗的大男人让你养着,你能接受,我可丢不起这个人,你要是不离婚,我就没有你这个女儿!丈母娘无奈的翻着白眼,深深叹息...
关于谁让他开机甲的开最强的机甲,拥最美的女人,做最巅峰的天才!陆云我都穿越了,变态一点怎么了?...
顾君兮,你这毒妇!顾君兮呵呵!(舔舔爪子,有我这么漂亮可爱的毒妇?)夕颜你是毒妇我也喜欢!这是一个妹子穿越到修仙界变成半神兽的故事,坚持一下,你可以看完的!...