前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的信息安全行業分析報告主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:智能手機;iPhone;源代碼開放
中圖分類號:TN919 文獻標識碼:A 文章編號:1671—7597(2012)0120011—01
0 引言
一般情況下,智能手機是指具有獨立的操作系統,可以由用戶自行安裝第三方服務商提供的程序,通過此類程序實現對手機的功能的不斷擴充,并可以通過移動通訊網絡來實現無線網絡接入的一類手機。
隨著科技的發展,智能手機的使用日益普及,智能手機的功能越來越強大,其在犯罪活動中充當著重要的角色。國內對電子設備數據提取技術的研究已有多年的歷史,開發出多種工具,下面簡單介紹幾種主要工具。
1)SIM con可使用標準智能卡的讀卡器來完整地顯示GSM手機SIM卡上的數據信息并提供分析報告。另外它使用計算取證數據的Hash值來保證取證前后數據的一致性。同時它也支持多國語言的字符集,能正常顯示不同語言下的文本信息。
2)Forensics IM是一個軟件工具包,它支持多個國家語言的字符集,能正常顯示各種語言下的短消息、電話簿和個人行程表等文本信息。此外,除了用來獲取SIM卡上的數據信息外,它還能對這些數據進行分析并以標準格式(DTF或HTML)生成分析報告。
3)SD Iphone Mobile手機數據恢復取證系統,是由國際數據恢復技術研發巨頭效率源科技公司推出的兼容Iphone越獄手機的系統。手機數據恢復工具的功能都比較全面,其后期推出的正式版(包含對越獄及非越獄版本的蘋果手機支持),還增加了郵件通訊分析、wifi訪問記錄獲取分析等功能,應用范圍更加廣泛。
1 libimobiledevice
從概念上講,手機取證就是從手機SIM卡、手機內/外置存儲卡以及移動網絡運營商數據庫中收集、保全和分析相關的電子證據,并最終從中獲得具有法律效力、能被法庭所接受的證據的過程。
實際上,能夠從蘋果iPhone,ipod touch和ipad中恢復數據的方法有很多,而一般情況下,法政部門可以免費使用一些特定的工具,例如JohnathanAdziarski’s。但是,很多情況下,我們不方便使用這些工具,或者我們所使用的蘋果操作系統版本不支持這些工具,那么我們該如何應對?
libimobiledevice,又稱為libiphone,是用于Linux支持iPhone/iPodTouch設備進行數據交換的數據包,libimobiledevice不使用任何權限數據庫,也不需要通過手機越獄來達到目的。
1.1 libimobi ledevice的功能
libimobiledevice具有使其他軟件能夠快速訪問蘋果設備的文件系統、回收蘋果設備的內部信息、設備的備份和存儲信息,管理Springboard圖標、管理已安裝的應用程序,回收地址簿、日歷、記事本、書簽以及設備上同步播放的音樂、視頻等功能。Libimobiledevice不僅僅可用作取證工具,它還可以使itunes與Linux操作系統相兼容,而Linux系統的安全性能良好,因此除了媒體文件夾和子文件夾,它不允許訪問蘋果設備上的全文件系統,即只允許訪問相冊和用此設備所拍攝的視頻,并且通過文件瀏覽器可以查看音樂目錄,并有權對其進行讀寫,這項功能是非常重要的。
為了保證數據的原始性,一般情況下將嫌疑設備連接到工作人員的計算機后,不能在電腦系統中對該設備進行數據統計以避免改變設備上的數據。因此,在Gnome桌面上我們需通過gconf—editor來關閉該設備的自動統計功能。
Libimobiledevice、ubuntu和Linux Mint Debian Edition整合在一起,使用Gnome虛擬文件系統(GVFS)來統計設備中用戶主文件目錄\.gvfs\下的多媒體文件夾的數量。但是如果禁止使用自動統計功能,就需要采取別的方法統計只讀文件的數量,可以用ifuse來處理,但前提是在設備中安裝該軟件。用ifuse軟件,設備可以自動識別并統計特定文件夾下的只讀文件,但如果在某一時刻有多個設備連接時,這需要用設備的UUID號來識別設備。用“ifuse[options]location”選項統計,例如“iphoneo ro/mnt/analysis”。如果調查人員手中恰好有一個越獄的蘋果設備,那么添加’-root’參數后可以完全訪問該設備上的用戶數據區。
在一個沒有被越獄的設備上可以用ifuse統計,但在寫保護的情況下,libimobiledevice可以通過GVFS訪問該設備。大部分多媒體文件是有價值的,除了獲取多媒體文件外,調查人員還要獲得其他具體數據,例如SMS信息,通話記錄或者類似的數據。
1.2 ibimobi ledevice-utiles
目前,有許多成熟的工具可以使用imobiledevice數據庫,在數據包管理系統稱為Debian imobiledevice-utils。具體功能由下列工具實現:idevicebaCkup,ideviceimgemounter,idevicescreenshot,ideviceenterrecovery,ideviceinfo,idevicesyslog,idevice_id,idevicepair特別值得一提的是ideviceinfo和idevicebackup。
ideviceinfo工具可以輸出關于手機本身的一些數據,包括設備名稱,序列號,操作系統版本和電話號碼。即使是上鎖的手機也會提供有價值的數據,盡管不如解鎖的手機提供的數據多。Idevicebackup工具的功能與itunes備份類似。它由用戶在特定位置創建一個設備備份。Idevicebackup2要求使用操作系統ios4.3,并且,只能從源數據中獲取。備份包括照片,視頻,以及來自設備中的數據,包括SMS信息,通話記錄,地址簿等等。
iPhone備份的文件是用十六進制進行重命名,保存在兩個mbdb數據庫中,用原始命名、位置和備份文件的MAC次數索引。Mbdb parse.py可以用來識別文件??梢孕薷膍bdb_parse.py來自動命名文件,但是標準輸出可以像ls-lh一樣輸出。Mbdb_parse.py的限制是它以十六進制顯示user/group值,并用unix時間顯示MAC次數??梢孕薷某绦驅崿F重命名文件為原始名字,但是程序現在無法公開。
2 結束語
隨著信息技術的飛速發展,手機功能還將不斷升級完善,其應用范圍也將更廣闊,而手機數據恢復技術,無論資費與否,功能完善與否,都將占據信息安全數據恢復行業更大的比重,成為信息安全行業發展的一個重要支柱。
在后續的研究中,我會進一步完善備份過程的取證步驟。
參考文獻:
在2000萬條開房信息泄露后,上海市民王金龍以個人名義向酒店發起訴訟。面對成千上萬名沉默的受害人,他希望以這場號稱“維護個人信息安全第一案”的訴訟呼吁更多受害人站出來維權,最終推動個人隱私和個人信息的立法保護。
“既然開了這個頭,再難的路,我也會堅持走下去。”王金龍對記者如是說,無奈的臉上閃爍著堅毅。這位擔任信息安全公司副總經理職務的“70后”前一陣辭去工作,做了一件看起來很“傻”的事情——為2000萬人討公道。
2013年10月左右,網絡上流傳的一份名為“2000萬開房信息”的資料在各大論壇提供下載。隨后,“查開房”網站開始出現,大量網友“躺槍”,驚呼“后脊梁直冒冷汗”。在泄露的數據中,房客開房時間介于2010年下半年至2013年上半年,包含姓名、性別、國籍、民族、身份證號、生日、地址、郵編、手機、固話、傳真、郵箱、公司、住宿時間14個字段。
在2000萬條開房信息泄露后,王金龍和伙伴以個人名義向酒店發起訴訟。2013年12月30日,此案在上海市浦東新區人民法院正式立案。
信息泄露的極端遭遇
相比很多人遭遇的只是一些騷擾或者詐騙電話,另一個具有廣泛流傳度的故事是一名受害人競因為開房數據的泄露而丟了未婚妻。本來,他們已到了談婚論嫁的時候。但女友居然在2000萬條開房數據中一不小心查詢到未婚夫在幾年前幾乎每周都有幾個晚上到酒店開房,且每次只逗留兩三個小時,這顯然不是因為出差。
盡管這名受害者解釋說,這只是他以前和前女友開房時留下的記錄,沒想到“陳芝麻爛谷子的事”給現在的生活造成這么大的困擾。最后,他的女友決定與他分手。
對比上面的故事,王金龍的故事也頗為曲折。這名35歲的小伙子本來不姓王,現今他之所以姓王,就是因為這次的信息泄露事件。2013年秋季,2000萬條開房數據泄露的消息傳出來。隨后,數據庫被廣泛應用,查開房的網站到處都有。出于職業敏感,王金龍搜到了自己在2012年12月出差廣州時的信息。當時,他曾入住漢庭酒店。
當王金龍注意這個信息時,也早有其他人注意到了。于是,不久之后,他便開始頻繁地收到比較精準的推銷電話,從賣房子、賣黃金期貨、炒白銀到推銷保險,甚至到能接收成人節目的衛星電視等。更讓他驚訝的還在于,這些推銷員能準確地說出他住的房子有多大、開什么品牌的汽車。
恍然間,王金龍發現自己就像一個裸奔的人,仿佛所有人都在盯著他,而他卻無一絲遮羞之布。這還不算驚險的,他還因此遭遇過更加離奇的事。一次,王金龍接到一個陌生電話:“是金龍嗎?”等他確認之后,對方卻不說自己是誰,而是讓王金龍去“猜”。有經驗的王金龍并沒有入套,結果對方說出一番讓他至今心有余悸的話:“等到你×月×日過生日時,我把禮物從廣州寄到你×地的家里去,你記得收快遞。”
這里面的生日信息、家庭住址信息和實際情況完全吻合。如此翔實的信息讓王金龍忘了戒備,以為對方真是他曾經的一位客戶,只是自己忘了這個人的姓名。于是,他就這么支支吾吾地跟對方敷衍了幾句。第二天中午,王金龍又接到那人的電話。那人自稱遇到麻煩,要向王金龍借一筆錢。直到這時,王金龍才恍然大悟,原來這也是騙子。
據了解,“2000萬開房信息”資料有兩個版本,其中一個容量1.7G的2000萬條數據基本指向2000萬個實實在在的個人,每人1條。此外,還有一個容量7G的資料文件,內容更詳盡,會有某人在某酒店幾年里的所有開房記錄,故數據量更大。
民間漏洞檢測平臺“烏云網”稱泄密信息于2013年中旬就已被盜取,泄露源無從查起,國家互聯網應急中心已就此事展開調查。究竟誰是泄露者,或許已經不重要,甚至把這樣的“兇手”繩之以法,也無法阻擋2000萬人數據泄露的危機。
為了規避越來越多的風險,王金龍決定改姓。不過,這個決定遇到了很大的麻煩,因為父母不同意,“大丈夫在世,行不更名,坐不改姓”,尤其改姓涉及祖宗。但是,最后與父母多次溝通后,他獲得了父母的理解。
當王金龍去派出所辦理改姓事宜時,警察覺得這個成年人過來改姓有點兒莫名其妙,因為這會帶來一系列的信息更換,比如身份證、戶口本、社??āy行卡等,而且麻煩的還在于畢業證恐怕就無法更換修改了。大約10天之后,他成了“王金龍”。當這些事情料理完畢,王金龍的維權行動開始了。
面對現實的無力與挫敗
在給記者的一份自白聲明中,王金龍這樣介紹維權的初衷:“我一直在信息安全領域工作,做了大量的企業咨詢和培訓服務。但是,畢竟個人能接觸的面有限,個人信息安全知識的傳播速度、廣度也都非常有限,我只能看著越來越多的個人信息在網上被隨意泄露甚至買賣,不斷有受害者由于個人信息的泄露導致感情破裂、錢財損失甚至失去生命?!?“我一直覺得應該去做點什么?!蓖踅瘕堅阡亯|一長串背景后,表示自己有責任、也有義務發起對泄露企業的訴訟維權。只不過,這沒有先例,國家也缺乏對個人信息安全的法律。因此,他也曾打消過發起訴訟的念頭。
隨后,王金龍在與相關媒體從業人員、律師交流后發現,只要提起訴訟,即便沒有立案,這種行動本身也會對個人信息安全的推動和普及有積極意義。于是,他開始了取證、訴訟的歷程。
王金龍并不孤獨,他還有一個伙伴叫張威。他們都是在信息安全行業工作十多年的白領,也都是開房數據泄露的受害者。張威說,有些推銷信息很有針對性,定位非常精確,這表示非常詳盡的個人信息已被外泄,并被分析過了。
記者在隨機調查中也發現,即便是理財類的推銷信息,也有著相當的精準度。有些高級白領收到的推銷信息,基本上都是門檻在百萬元級別的理財計劃,而另外一些普通白領收到的只是門檻在數萬元的理財計劃。這證明,人們的信息早已被反復地精準使用。而這次2000萬人的開房信息泄露,也早已被“物盡其用”。由于不同的網站提供下載,尤其是BT方式的傳播,完全無法禁止,所以,資料已經是幾何級數的泄露。
王金龍通過下載相關信息制作了一份《上海市民信息泄露情況分析報告》,他得出的結論非常驚人。上海有86萬名受害人,居全國首位。上海戶籍人口才1400多萬,這就意味不到20個人中就有1個人信息被泄露。記者通過身邊十來個人的身份證信息,驗證了將近有一半的人信息已經被泄露。雖然有的當事人否認曾經在彼時彼地開過房,但是,身份證信息以及他們的手機號則可以輕松檢索到。
幾乎每個人在得知自己中招后都表現出憤怒,但隨后也就變得無可奈何。泄露的后果已經無法改變,作為受害者還能做些什么?王金龍說:“作為信息安全講師,我們一直告訴別人如何做好信息安全,到最后發現連自己的隱私都保護不了?!弊罱K,王金龍和張威決定用實際行動推動信息安全保護。隨后,他們開設了2000萬條開房信息“受害者聯盟”的QQ群、公眾微信號。王金龍表示,他希望通過這兩個渠道,先將有意維權的受害人集中到一起,商討如何維權。第一個加入“受害者聯盟”QQ群的受害者,就是丟了未婚妻的那位網友。
在了解到更多受害者的故事后,王金龍和張威更加堅定了訴訟之路。隨后,他們在朋友的介紹下,聘請了上海市律師協會電子商務與網絡法律委員會主任商建剛及其同事黃海東律師,開始訴前準備工作。毫無疑問,工作是艱難的。就拿取證來說,王金龍到閔行公證處去了三次,因為電子取證需要提前預約,需要一周時間。前兩次去,他反復進行演練和操作。第三次去,他花了4個小時才將1.7G的數據庫完整下載。這個過程還被全程錄像。不僅如此,他還將數據庫刻成光盤,讓其成為有公信力的查閱證據。
訴訟維權之路的艱難
最后,王金龍和張威提起訴訟,要求判令酒店以書面形式公開賠禮道歉,賠償經濟損失20萬元。他們解釋說,本來打算要求賠償1元。但認真考慮后,覺得不妥,要求賠償1元意味告訴民眾,原來個人信息不值錢。
王金龍和張威為提起訴訟支付了高昂的律師費、訴訟費、公證費等。王金龍告訴記者:“如果官司勝訴,費用還有盈余的話,多出的錢將全部用到個人信息保障公益維權事業上?!?/p>
“我們希望能給那些不重視信息安全的商家以警醒,給那些認為可以隨意買賣個人信息的人員以警醒,給那些正利用我們的信息謀取不義之財的人以警告?!蓖踅瘕堈f。他希望那些因個人信息泄露而帶來苦惱的兄弟姐妹們也能站出來,提供被侵權的相關法律證據,一起吶喊、一起維權、一起伸張正義,推動個人信息保護立法。
“在2000萬條開房信息泄露后,以個人名義向酒店發起訴訟,這在國內屬首例?!鄙探▌偮蓭熯@樣說。現在,大多數受害人還在沉默。他希望通過訴訟,讓少數人先邁出實質性的一步,這也是為了呼吁更多受害人加入進來維權,最終能推動個人隱私和個人信息的保護。
商建剛認為,我國《侵權責任法》規定,提供服務的商家應盡到安全責任。這個安全怎么定義?是僅指人身、財產安全,還是也包括信息安全?比如,如果酒店管理不善,消費者的行李在酒店客房內被盜,或客人在大堂因地滑摔跤,酒店應該承擔責任。根據這樣的邏輯,如果酒店管理不善,導致消費者信息泄露,消費者當然也有權索賠。
作為我國信息產業的策源地,中關村在全球率先布局大數據產業,打造完整產業鏈,不斷完善產業鏈各環節,做大做強一批龍頭企業,促進新一代信息技術產業創新鏈互動和融合發展,為催生新的經濟增長點、保障國家信息安全、加快工業和信息化的深度融合做出重大貢獻。
風起云涌,“大數據”的浪潮正席卷中關村這塊創新高地……
神州數碼:讓城市智慧起來
讓我們來看下大數據是如何應用于城市管理的。12月10日晚上,中央電視臺《新聞聯播》播發了一條智慧城市的新聞,《借助大數據,城市更“智慧”》,展示了張家港市建設市民服務中心,通過大數據技術的支撐,實現部門之間數據庫信息的互聯互通,實現城市的智慧管理。此平臺的開發者就來自中關村——神州數碼控股有限公司。
從聯想集團分拆出來的神州數碼公司,致力于整合全球信息產業資源,2010年提出了“智慧城市”戰略,通過以云計算、移動互聯、物聯網為代表的信息技術手段進行融合創新,推進中國新型城市化進程。
神州數碼負責人介紹,智慧城市,實際上就是圍繞城市、城市的市民、經濟組織、城市運營管理者等主體而產生的智慧化應用服務。智慧城市已經成為經濟社會大轉型升級中的有效抓手,智慧城市的建設要靠“城市公共信息服務平臺”來進行系統支撐。
城市公共信息服務平臺,就是立足城市,充分利用新一代信息技術,在解決當前各類問題的同時,能夠構建一套融合創新的機制,保障城市的健康可持續發展。
為此,神州數碼構建了一套獨有的“城市虛擬映像”體系。通過這個“城市虛擬映像”,將針對每個主體的應用服務抽取出來,形成對現實世界的服務。如何構建“城市虛擬映像”呢?首先要抽取出城市的“主體”,比如市民是城市的一個重要主體,市民是一個自然人,圍繞自然人的各種要素抽取,建立一個“數字人”的模型,并通過從現實世界獲取的各項針對這個人的非結構化數據,數據清洗、關鍵數據抽取,形成一個人的數字映像關系,從而實現非結構化數據的重組。針對現實的各項城市公共服務,就是在城市虛擬映像中形成的。
這一架構的優勢在于城市的虛擬映像是穩定的,而城市服務的需求是多樣的,構建了這樣一個穩定的城市虛擬映像,就可以隨時根據需求,開發出不同目的、不同主體的公共信息服務應用。在城市虛擬映像中,實現了數據的交互融合,也就實現了城市管理過程中綜合調度管理的基礎。
在城市虛擬映像的架構體系下,神州數碼完成了智慧城市公共信息服務平臺的構建。目前公共信息服務平臺2.0版包含了市民融合服務平臺、企業融合服務平臺和城市管理服務平臺三個平臺。目前,神州數碼“智慧城市”戰略布局在全國70多個城市展開,并與近20個城市簽訂了戰略合作框架協議,已經成為中國市場領先的“中國智慧城市專家”。
用友:
用好“大數據”,提升產業升級
大數據這一“新式裝備”,如何來提升傳統產業、進行轉型升級?只要你想得到、用得上,大數據的利用將隨處可見。比如,大數據與用水產養殖,可通過分析大量傳感器、環境、市場、客戶數據,逐步實現水產養殖的自動控制,并進一步來指導市場營銷和產業布局等。
中關村管理軟件企業——用友軟件公司負責人認為,對傳統企業來講,大數據的思想和技術對企業的管理提升具有更多的現實指導意義,大數據在傳統企業的應用中體現更多的是催生出一些新的工作模式,商業模式和新型的企業文化。
目前,用友公司已經與很多傳統企業合作,助推企業轉型升級。例如,用友為某大型燃氣公司搭建集成平臺,解決了此企業子公司多、無法集中管理等多重問題,為企業建立了全新的、系統的一體化平臺。再比如,為采集銷售客戶數據用于指導市場營銷策略規劃,將員工對產品的評論意見進行爬蟲搜索、分類整理和分析,用來指導新一代產品設計;利用歷史多年銷售整體數據進行產品系列結構和配比模擬分析,結合客戶購買行為統計分析產品的銷售組合頻率,來進行相應的產品捆綁組合促銷策略指定。
此外,用友還為中國郵政儲蓄建立體系先進、數據集中、監管完善的管理系統,所有數據在財務管理系統中生成全行的報表和一本賬,搭建起全國大總賬,幫助銀行實現精細化、規范化、科學化管理的經營發展戰略。
高德軟件:
讓交通盡在掌握
上下班、出行游玩……交通成為我們不得不面對的問題,尤其是北京、上海這樣的特大城市。那么大數據是如何應用于交通的?讓我們來看下中關村交通信息領軍企業高德軟件有限公司是如何做的。
如果你想開車出門,但卻擔心交通狀況,怎么辦?高德推出了一個系統,叫全平臺的路況趨勢預測查詢,可以幫你預測路況,也可以幫你規劃下更加合理的出行路線,以規避擁堵,而且系統會給出達到目的地的預計時間。而如果你已經出門了,卻不知道前邊路況怎樣,高德的新應用“前方路況播報”可以告訴你,你可以根據情況及時更改路線或做其他打算,省去不少麻煩。
高德通過搜集的海量行業數據,為大數據技術提供了用武之地,這其中有來自出租車、物流車的行業浮動車數據,用戶生成的眾包數據,經匯總、處理后生成反映實時道路路況的交通信息。通過大數據挖掘,可以為公眾的各種使用場景,提供預測性的、具有指導性的、個性化的交通信息服務。
為了更好地進行交通數據挖掘,分析個人出行的影響因素,比如特定道路的擁堵規律、交通水平,以及工作日或節假日影響、天氣影響的擁堵水平波動等,高德更是先進地推出了“基于大數據的道路速度海量通數據擬合”(高德SpeedProfile),將每條道路的歷史碎片速度信息記錄、存儲,通過進一步挖掘,為大數據技術實現的交通預測和路徑規劃提供了依據和積累。
高德利用大數據這枚利器,為公眾個體提供了個性化的出行服務,以用戶大數據為驅動,達到改善產品體驗的目的。特別針對車主群體,通過對歷史數據的分析,為每條道路的通行狀態建模,分析出車主在不同時刻的行程真實耗時分布。其次,通過海量的最真實的統計,為出行提供決策分析;通過建立道路通行時間、路口等待時間數據庫,為導航規劃提供更有價值的參考,為用戶規劃最高快捷的道路,利用海量軌跡數據,針對重要居民區和重要辦公區、商圈的公眾通勤導航數據,推出了車主最常走的“黃金路線”,體現了根據駕車人經驗的、大數據實現的路線推薦的真實價值。
高德作為交通信息領軍企業,在采集和融合行業數據方面,具有深厚的服務和運營經驗。目前,高德提供的交通信息服務覆蓋城市超過50個,訪問用戶超過1億,日訪問用戶量80萬,日使用時長21.8分鐘,在服務內容和用戶量都達到一定規模和社會影響力;截至目前,累積公眾用戶量超過一億,5月覆蓋道路里程1.47億公里,為高德的城市交通路況大數據分析奠定了數據基礎。
云基地:
用“大數據”保障公共安全
3秒鎖定嫌犯,這聽起來不可思議。但大數據的應用于公共安全領域,讓這成為可能。
乘坐同一班列車,住同一酒店的兩個人可能是同伙,刑偵人員將不同線索拼湊起來排查疑犯,可是來自于多源數據的處理在傳統架構上,需要數小時甚至整日。在北京亦莊云基地建立的天云大數據平臺,將這一操作縮短至3秒,同時描述出疑犯的交往關系。公安人員可以基于計算出的線索流暢的思考。
在公安日常工作中,對于人口、違法犯罪、出入境、酒店網吧信息、車輛駕駛員、在逃人員、被盜搶車輛等信息有著大量的查詢需求,尤其是實戰中,各地各部門迫切要求實現跨地區、跨部門的信息快速查詢,需要獲得及時、全面、準確的信息支持,進而實現統計分析和關聯綜合利用。
如今,警務信息化引領公安整體工作和隊伍建設正步入建設階段,公安“大情報系統”建設與應用可以將警察管理和警察行動建立在動態的收集、分析、測繪犯罪信息的基礎上,實現預防和打擊犯罪的目的,其中精準的情報是基礎、有效的戰術是手段、警力及相關資源是保障。
新影數訊:
預測電影票房的“法寶”
大數據可以預測交通路況,同樣可以預測電影票房。新影數訊iFilm+利用社交網絡和數據挖掘預測票房,據稱準確率可達85%。
2012年下半年電影《1942》上映前夕,在外界對這部電影一片贊譽和看好,紛紛預測票房將突破7億元時,新影數訊創始人劉晗卻在外出休假前了一條微博,斷言《1942》的票房不會超過4億元。電影的制片方甚至前來質詢:“你是哪個競爭對手派來‘黑’我們的?”
電影上映后,劉晗的預測卻得到了印證?!?942》的票房最終收于3.6億元左右,和自己團隊的預測結果幾乎相差無幾,僅僅達到了制片方目標和業界預測值的一半多一點。
預測結果,究竟從何而來?他首先確定出影響票房的幾個變量,如演員、檔期、上映時間、首映地,接著就要推算出公式中的定量,他的做法是從1990年以來上映的電影中抽樣出四五百部,從統計年鑒中查到數據,然后讓計算機逆向推導出定量,從而確定公式。預測時再把社交網絡中反映出的變量填入公式,進行測算。
新影數訊每天處理上億條社交網站上網友對電影的評價信息、娛樂新聞和明星八卦等,每個季度都要追加新的服務器和硬盤以應對暴增的數據處理量,嚴格說來,他們掙的是數據的錢。
不僅如此,新影數訊的另一個業務更前衛——為挑選演員甚至導演給出“數字上的建議”。根據歷史參數和社交網絡上的數據分析來給出判斷?!昂芏鄬а萏暨x演員是根據經驗,而你只要告訴我要找什么類型的角色,系統就會根據演員的外形和之前對類似角色的演繹效果給出匹配?!?/p>
如今,新影數訊已經和十幾家影視公司合作,為萬達娛樂、華策影視、小馬奔騰、光線傳媒等公司做營銷策略咨詢,更有香港、好萊塢的電影公司上門找他們做數據測算,公司也獲得了海銀資本的投資,成為海淀區中關村雛鷹人才基地的一員。
拓爾思:讓搜索更容易
搜索,大家并不陌生,中關村企業百度公司做搜索引擎可謂龍頭老大。而這里要說的是另一家企業,北京拓爾思信息技術股份有限公司。
拓爾思憑借非結構化數據管理方面和海量信息處理方面的突出優勢,推出了平臺+行業解決方案+服務的綜合產品線,把海量非結構化信息處理技術和Hadoop架構進行有效結合集成,結合企業在大數據采集、管理、分析挖掘、可視化方面的具體需求,針對企業數據、機器數據、社會化數據,以TRS海貝大數據管理系統為平臺支撐,推出了TRS機器數據挖掘引擎、TRS社會媒體分析云服務和TRS大數據一體機等相關產品和全面的解決方案,滿足政府和企業在大數據時代對數據分析、管理的新需求。
TRS海貝大數據管理系統是拓爾思大數據產品系列的核心產品之一,兼容Hadoop標準,融合搜索引擎技術,可實現對海量結構化和非結構化數據的搜索、分析和挖掘,發揮平臺性的支撐作用。
TRS機器數據挖掘引擎是面向物聯網、電子商務、醫療、電信、金融等領域,為了滿足大數據環境下的機器數據存儲、管理、檢索、分析、可視化等應用需求,推出的日志挖掘和用戶行為分析系統,可廣泛應用于IT運維、安全審計和用戶行為分析等方面。
TRS社會媒體分析云服務平臺是建立在TRS數據中心基礎上的大型在線服務平臺??擅嫦蛘⑵笫聵I單位和個人,以在線云服務的方式提供信息監測、統計分析、關系挖掘、傳播效果評估等一系列服務,范圍涵蓋網絡媒體、論壇博客、微博SNS等全媒體,囊括了事前預警、事中分析、事后處理,為信息的全面分析構建了完整的生態鏈條。此平臺在大數據的智能挖掘、熱點分析方面具有業內領先的技術優勢,從復雜的社會關系中挖掘出有用的信息,并通過即買即用的在線方式為客戶提供必要而有效的應用。
拓爾思—華為信息檢索一體機是經深度優化和技術融合的高性能檢索服務器,支持自然語言及智能擴展檢索,提供結構化、半結構化和非結構化數據的聯合檢索。一體機設計了高可靠的體系架構,兼容國際主流技術標準,接口開放,支持PB乃至EB級大數據的精確搜索,能夠滿足用戶的高并發訪問,可為媒體、金融、政府、專利等行業或領域的企業級檢索提供高效的計算和支撐環境。
金電聯行:
服務金融創新
有媒體報道說,以數據分析幫助供應鏈中的小企業拿到銀行的信用貸款,金電聯行不小心撬動了中國的中小企業信貸革命。
中關村企業金電聯行(北京)信息技術有限公司,做的將大數據應用于金融創新,基于大數據與云計算技術創建了“客觀信用評價體系”,技術載體為“數據挖掘機器人信用信息云服務平臺”。其金融創新業務集中體現在“大數據信用”。
“客觀信用評價體系”,通過植入云端機器人對被評主體網狀與線性的海量、高速、多樣、易變的客觀信息,進行全自動、全天候的挖掘、分析與評價,提供非主觀的全計算性信用結果,與實時的跟蹤評價,從而實現了采集信息、運用數據、過程分析、評價結果和風險預警的客觀性、智能性和高效性。評估后,會得出各個模塊的子因素評價結果,形成針對中小企業的信用分析報告。
“數據挖掘機器人信用信息云服務平臺”,數據采集模塊由“數據挖掘機器人”完成,數據分析模塊由“客觀信用評估體系”完成,并可以實現數據實時更新以完成追蹤監管。云服務平臺的輸出端有多種形式的展示,滿足融資者、銀行等金融機構和政府部門的需求。整個評估過程實施全數據導入控制,實現了以數據作為貸前篩選、貸中審核、貸后監管的信貸全流程管理的唯一依據。