前言:想要寫出一篇引人入勝的文章?我們特意為您整理了探究信息的影響和未來研究方向范文,希望能給你帶來靈感和參考,敬請閱讀。
1基于傳播過程的模型
任一用戶發表一條博文,只有其粉絲可以看到,用戶的粉絲看到后,可能會評論,或者轉發,或者發表與該信息話題相關的博文,那用戶的粉絲的粉絲就能有機會閱讀或者繼續傳播該條博文。如果原始博主的粉絲對其信息不感興趣,而沒有做出傳播的行為,則該條信息就會被逐漸忽略。最早,對于傳播動力學的分析是從傳染病模型開始的。在典型的傳染病模型中,主要是將人群中的個體分成三類,每一類處于一個典型狀態。其基本狀態包括:S(susceptible)--易染狀態(通常為健康狀態);I(infected)--感染狀態;R(removed)--被移除狀態(也成為免疫狀態或恢復狀態)。研究中主要用到的模型有SI、SIS、SIR以及SIRS,模型中,狀態為S的個體會以概率β感染到該疾病,狀態為I的個體會以概率γ恢復。在SIS模型中,那些恢復后的個體會自動又變成易感染狀態,在SIR模型中,個體會保持在恢復狀態,而在SIRS模型中,個體會在恢復之后又以概率α變成易感染狀態。這種模型主要是側重于傳播過程的動力學和個體在這幾個狀態之間的重新分配。通常使用微分方程來表示這幾個狀態的個體數量的變化。例如在SIR模型中,用下面的方程式來構建模型:=-,=-,=dstditdrtitstitstititdtdtdt其中s(t),i(t)和r(t)是這三個狀態在每一時刻所占的比例,且s(t)+i(t)+r(t)=1。這種模型通常只是對信息傳播規則的建模,而沒有考慮傳播網絡的拓撲結構對傳播行為的影響。隨后一些研究分析了在不同類型的網絡上,傳染病模型所表現出的不同的狀態。Moreno等人發展了Daley等人在1964年提出的謠言傳播模型。該模型基于SIR模型將人們分為Ignorants(沒有聽過謠言的人,類似于Susceptible)、Spreaders(謠言傳播者)和Stiflers(聽到謠言但并不傳播謠言的人)三種類型。上述的傳染病傳播與與信息在中的傳播類似。一條博文首先要傳播給博文作者的直接粉絲,一部分粉絲會轉發該博文并變成轉發者,隨后影響他們的粉絲,這些轉發者在隨后看到該博文時,可能會再次轉發,也可能不再理會。列舉的幾種傳染病模型與信息傳播特征的類比,進一步說明了信息傳播與傳染病傳播機制相一致。Liu等人參考SIR傳播模型,使用NetLogo構造了一個基于主體的模型。模型中,將用戶分成三類:傳播者,未知者和不受影響者,并使用用戶出入度的比例代表其的影響力,同時考慮了類似Twitter的網絡結構的無標度性,信息傳播的特性以及謠言的最大傳播時間。許曉東根據社區信息傳播網的特性,使用SIR病毒傳染模型刻畫謠言傳播過程,并借助計算機仿真研究傳染率和網絡的拓撲結構對謠言傳播規模的影響,發現降低有效傳播率和減小網絡度分布熵有利于縮小謠言傳播規模。Wang等人提出那些沒有關注轉發者(Retweetingusers)的用戶(Externalusers)也會有可能轉發信息,以及轉發者會多次地轉發相同的信息,并以SIS模型表示的傳播為基礎,添加了這兩種轉發行為,來描述信息參與者的動態變化。其他研究者沒有直接采用經典的傳染病模型,而是根據具體的信息的傳播過程及特征來構建傳播模型。Xiong等人將Twitter網絡中的用戶按對信息的接受程度劃分為四種類型(Susceptible、Infected、Contacted、Refractory),并提出SCIR模型,探討了模型仿真過程中隨著傳播速率改變的整個模型網絡的動態變化。Wu等人根據中用戶發表、瀏覽、回復和轉發博文的基本行為,將的信息交流分成信息、信息接收、信息加工、信息傳播四個階段,并考慮信息丟失(被用戶忽略的信息熵),提出競爭窗口模型,描述了信息的動態傳播。上述的基于傳播過程的模型,只是描述了網絡中用戶對信息的接受狀態,以及信息傳播的動態變化,但卻沒有考慮用戶之間的個體差異和網絡的拓撲結構對信息傳播的影響。
2經典影響力模型
模型從一組初始的活躍節點開始,沿著離散的時間軸以同步的方式不斷地將其他節點轉換為活躍態。線性閾值模型(LinearThresholdModel)在LT模型中,在時間t每一個節點v都有一個激活閾值,v所有的處于活躍態的鄰居節點都來嘗試激活v,如果所有鄰居活躍節點的影響度之和超過了v的激活閾值,則v在時間t+1轉換為活躍態。且節點v的活躍鄰居節點可以多次參與激活v。獨立級聯模型(IndependentCascadeModel)在IC模型中,在時間t處于活躍態的節點u可以獨立地以概率u,vp激活處于非活躍態的鄰居節點v,如果v被成功激活,則在時間t+1,轉換為活躍態。且不管u在時間t是否激活v,在后續的時間中,u不再激活v。由于這兩種模型都是基于離散的時間軸上以同步方式模擬傳播過程,并不符合真實的社會網絡的傳播方式。Gruhl等人[33]對IC模型進行了改進,通過給出一種計算節點間閱讀概率和復制概率的算法,給每條邊賦予一個傳播行為發生概率,使IC模型能夠適用于傳播可能發生延遲的環境。在此基礎上,Saito等人[34]考慮傳播中連續時間延遲的影響,進一步提出了CTIC(ContinuousTimeDelayIndependentCascade)和CTLT(ContinuousTimeDelayLinearThreshold)。為了使模型更能適應真實社會網絡,Saito[35]考慮傳播的異步性將IC和LT模型擴展成AsIC和AsLT模型,模型中使用一個連續的時間軸,并為圖中的每條邊添加時間延遲的參數。冀進朝等人[36]基于節點間影響不僅存在著衰減,也存在著加強和維持原狀的思想,在IC模型的基礎上提出完全級聯傳播模型。
3基于用戶影響力的模型
例如權威的用戶或處在中心位置的用戶都會產生較大的影響力,促進信息的傳播。有研究者就從用戶對信息的影響力排名來預測信息的傳播趨勢。Yang等人[40]基于對Twitter網絡中的用戶行為的大量實證研究提出了一種通過對節點影響力的評估從而預測信息傳播趨勢的LI模型(LinearInfluenceModel),證明了該模型可以非常準確地評估出節點的影響力并且能可靠地預測出信息在短時間內的傳播范圍。張闖等人將網絡中節點屬性分成靜態和動態,并提出預測目標的節點影響力,在此基礎上提出一種基于節點屬性進行信息預測的屬性、節點數、傾向(ANV)模型。實驗采用BP神經網絡預測方法,通過新浪數據預測電影票房,結果表明帶有節點屬性的方法比沒有節點屬性的方法的擬合和預測更為準確。Ho等人[42]提出中兩種傳播關系,Rigid-propagation關系和Loose-propagation關系,并分別以這兩種傳播關系構建兩種影響力樹,其中UBI(上限影響力樹)的邊代表一個從父節點指向子節點的Rigid-propagation關系,LBI(下限影響力樹)的邊代表一個從父節點指向子節點的Loose-propagation關系。然后使用這兩種類型的影響力樹模擬的信息傳播。
由于具有自己的新特征,其研究角度和方法都有待改進,未來的研究可以考慮以下幾個方向。目前絕大部分的信息傳播分析都是以靜態網絡拓撲結構為基礎的,但是在現實的中,用戶之間的關系網絡是隨時間動態變化的。下一步的工作需要將網絡的動態變化特征添加到信息傳播模型中,研究其演化規律。網絡中,由于現實的社會關系,共同的地理屬性以及相同的興趣愛好,用戶會自發地形成不同的社區。大部分的信息傳播都是在社區結構內,因此傳播路徑都相對較短。目前有些信息傳播模型都是在整個網絡結構上定義,而忽略了社區結構對信息傳播的影響。社區中用戶的關系比較緊密,而社區間聯系比較稀疏,通常連接各個社區的用戶是各社區通信的橋梁。結合社會網絡分析方法,研究網絡中的社區結構,并分析信息在社區中及社區間的傳播規律是一個重要的研究領域。在分析博文內容時,需要注意由于博文的內容簡短,口語化,較碎片化,就會導致對一條博文的主題難以準確把握。所以在分析博文內容特征時,為了提高精確度,不但需要研究更準確的特征關鍵字提取方法,而且要結合上下文情境來分析,這些上下文包括該條博文前后的博文、粉絲的評論等。信息的傳播體現在網絡中處在各個時間段的結點對信息接受狀態的變化,Zeng等人將話題的狀態描述成“不被關注”、“出現”、“增長”和“衰減”四個階段,通過網站結點對話題的不同接受行為分析話題在各個狀態之間的轉變,進而描述話題在Internet中的動態傳播。這類未采用經典傳播模型的研究方法也可以具體應用到網絡中,通過用戶對博文的關注轉發程度和概率,描述博文的動態傳播過程。基于影響力的信息傳播模型中,大部分的參數都是根據經驗取值,并沒有通過真實的傳播數據統計獲取,這樣勢必會影響模型的準確性,而不能很好地預測信息傳播的趨勢。所以在未來的研究中,獲取精確的數據來訓練模型參數是構建傳播模型的重要方面。
作者:王晶 朱珂 王斌強 單位:武漢大學