笔趣阁

穿越小说>我的大猪蹄子女友 七斤 > 第27頁(第2页)

第27頁(第2页)

作為一名合格的科研工作者,謝與非先開始做文獻收集工作。

snetkI上的文獻也不算很多,於是謝與非只好從最基礎的做起——先篩選知名小說網站和app。

不多時就進入到了著名的網文論壇,從中篩選出基本符合要求的平台若干。

然後再細分,哪些網站以霸總小白文見長,哪些受眾比較多樣化。

接著呢,就是科研狗們最喜歡的收集數據階段。

謝與非花了兩個晚上,研究了各類榜單的排名和更依據,從論壇里搜集了大量資料,甚至搞明白了幾大平台女頻的各種打榜暗箱操作。

於是她——開始看小說了?

不,蠢蠢欲動想要寫個刷票小程序和網站的算法較量一下,看能不能被識破。

但是理智告訴她,做研究要不忘初心,總結霸總的行為規律才是要任務,於是又回歸到了霸總文本身。

開始的時候,謝與非做了個exce1表,裡面列了各個網站排名前十的霸總文,並且按照簡介和名字做了分類。

通過閱讀大量的書評,掃文號和論壇討論貼可知,霸總文只是一個大項目,裡面還分有不同的小類與流派。

根據題材可以分為重生,穿越,現實,古代等等,穿越下面還有,等小類。

根據風格還可以分為「甜寵型」,「強迫型」,「型」,「契約情人型」等等。分析平台的榜單排名可知,目前「虐戀型」已經過時,「甜寵型」和「火葬場型」正在當紅。

表列到這裡,謝與非發現單純的表格已經不能滿足她了,這種複雜的分類需要一個坐標系。

於是畫起了橫軸和縱軸。

除了文章風格,作為霸總文靈魂的「霸總」當然也需要分類。

什麼型霸總,粗暴型霸總,外冷內熱型霸總,智商極高型霸總,反正也是需要一個坐標系來畫明白的。

畫著畫著圖她的思維又開始奔逸了,像霸總文這種具有高度同質性並且特徵明顯的小說,是不是可以先收集大量數據建立一個語料庫,然後再寫一個算法讓aI自動出產霸總文,只要輸入想要的屬性標籤,然後就可以自動從語料庫里摘取句子生成語段。同理可證那些打臉文、、文都可以一樣產出。

小貼士:如果覺得不錯,記得收藏網址或推薦給朋友哦~拜託啦(。&1t;)

&1t;:

已完结热门小说推荐

最新标签