Skip to Content Facebook Feature Image

女童不慎從14樓墜下僅受輕傷 起身自己搭電梯回家

博客文章

女童不慎從14樓墜下僅受輕傷 起身自己搭電梯回家
博客文章

博客文章

女童不慎從14樓墜下僅受輕傷 起身自己搭電梯回家

2020年05月15日 19:50

梯回家,讓人不禁驚呼:命大!據悉,女童墜落先撞到2樓遮雨棚,最後跌到小區1樓的軟土花叢中,這應是她幸運保命的2大關鍵。

這起墜樓事件發生在13日下午5時30分左右,女童放學回家後,到住家14樓頂樓騎腳踏車。因頂樓風大,鐵門被吹到關起來。女童回不了家,竟異想天開打算從頂樓往下攀爬到6樓的住家,結果失足墜落至1樓花圃。

從小區監控錄像可以看到,只見女童墜樓後,還在地面花圃滾動了幾下,就自己爬了起來,走進大樓搭電梯回家。家裏讀初中的姐姐見她滿臉是血,嚇到急忙報案,將女童送醫檢查。後來女童被送往亞東醫院急救,查出有氣胸情況,已在進行手術中。

警方勘查現場,發現女童墜落,疑先撞到2樓遮雨棚,最後掉落軟土的花圃,所以減緩了墜樓時的重力加速度,因此幸運保命。




神州快訊

** 博客文章文責自負,不代表本公司立場 **

(原標題:一周4000篇、全球超2.3萬篇 新冠論文太多,科學家們看不過來了)

疫情下,儘快將有關新冠病毒的最新研究發表,供全球科學家分析和研究,是科研人員們為終結疫情所做的努力之一。然而,令人目不暇接的論文,也讓一些科學家感到「煩惱」。

稱,美國病毒學家蒂莫西·謝漢(Timothy Sheahan)希望自己能夠趕上新冠論文發表的速度,但他苦惱地發現這實在太困難了,因為論文實在太多了,僅僅上周就有4000篇相關論文被發表。「我確實跟不上……」在北卡羅來納大學教堂山分校工作的謝漢表示,“這幾乎是不可能的!”

論文太多,該怎麼辦呢?一些數據科學家、軟體開發者和論文發佈機構正致力於改變這一現狀。

△圖據《科學》雜誌

論文「井噴」,20天翻一番

根據估算,自從今年1月第一篇關於新冠病毒的論文被發表以來,現在全世界已經有超過2.3萬篇關於新冠病毒的論文了。而且這一數字幾乎每20天翻一番,是科研史上最大的一次論文「井噴」。

「人們根本沒有時間讀完整篇論文,提取出有價值的信息。」約翰斯·霍普金斯大學彭博公共衛生學院的傳染流行病學家凱特·格拉博夫斯基說。

在數家科技巨頭和白宮的支持下,一支由數據科學家、軟體開發者和論文發佈機構組成的團隊,希望儘快創建出一個集納成千上萬免費論文的電子資料庫,並開發出搜索工具、幫助科學家們儘快找到他們需要的信息,儘早終結這場疫情。

雖然還不能說有重大進展,但是研發這種搜索工具的努力僅僅開始數周,已然獲得了突破。目前,全球正在努力勸說論文的發行機構迅速將所有涉及新冠病毒的論文免費化、使得大家都可以查看。然而研究發現,目前存在的障礙是,仍有20%的論文是需要付費閱讀的,而且這一數字可能會增長至50%;還有一些研發的新搜索工具是由不知名機構所研發出來的,權威性待考證。

例如,謝漢就從未聽過幾個新近研發出來的工具論文數據演算法背後的機構。還有一些搜索工具的介面設置得不是那麼友好。科學家們懷疑這些工具是否能夠幫他們找到真正想要的信息,搜索質量如何?「人們總是傾向於過度渲染他們的產品,這樣出來的一些論文數據根本不支持他們的結論。」謝漢無奈地表示,“真是一團糟!”

有數百個團隊正在為之努力,希望基於兩個基本的原則把一切理順:一是建立簡單可查的論文集納器,包括條理清晰的排列方式和重點核心論文置頂推薦;二是建立自動搜索工具,利用人工智慧(AI)來管理數據。

已收集5.9萬篇論文,但仍問題重重

3月16日,創建新冠病毒論文庫的努力得到了美國白宮科學技術政策辦公室的鼎力支持,幫助發行機構和科技企業共同建立了新冠病毒開放研究數據集庫(CORD-19)。該資料庫是迄今為止最大的單一館藏,目前已收集了5.9萬篇已發表論文和科研成果預印本,關於冠狀病毒的研究可以追溯到上世紀50年代。

△資料圖片

為了達到建立資料庫的目標,一些科技巨頭的機器學習小組開始介入。谷歌、陳-扎克伯格研究協會、美國國立衛生研究院、艾倫人工智慧研究所等機構都在致力於用不同演算法來檢測和搜集論文。看上去,利用數字編碼關鍵詞已經初步能夠搜索出想要的信息。參與者們還能將PDF文件轉化成為一種可供數據集庫辨識的格式。研發者希望CORD-19不僅僅是能搜索出相關的文獻,還能汲取出多篇論文中的信息價值模式。

阿姆斯特丹大學文獻計量學研究員喬奧瓦尼·克拉維扎高度讚賞了CORD-19,稱這是一個「令人驚喜的成果」。但是他和同事們也發現了該系統的一些問題,比如CORD-19中,超過60%的論文沒有說明集庫創造者的搜索項目,比如無法分清“新冠病毒”和“SARS病毒”(兩種病毒都可能引發嚴重急性呼吸綜合征),從它們的屬目、摘要、關鍵詞來看都很模糊。這些論文都由研發者在今年4月17日上傳到生命科學預印本平台“ bioRxiv” 。這也意味著,克拉維扎表示,這部分論文可能不僅僅是針對新冠病毒的研究成果。

克拉維扎的團隊還發現,CORD-19中只有4萬篇論文能看到全部的文本,且很多數據的設置只針對用英語寫作的論文。

此外,不是所有的流行病學論文都是免費的。應科學贊助者和政府科研顧問的要求,大部分主流論文發佈機構已經保證儘快將所有涉及新冠病毒的論文免費化。但荷蘭代爾夫特理工大學的尼古拉斯·羅賓遜·加西亞教授的研究表明,尚有20%今年發表的新冠研究論文需要付費閱讀,且付費的發行方比免費的發展還快。4月26日,加西亞將研究結果發表在bioRxiv的一篇預印本上,他預計,如果這種趨勢繼續,到今年6月1日,將有一半的新冠病毒論文都需要付費閱讀,這也將會成為構建數據論文庫的一大障礙。

要質量,而非數量

在約翰斯·霍普金斯大學彭博公共衛生學院,凱特·格拉博夫斯基的團隊嘗試用另一種方式來創建新冠論文資料庫,他們更多的是看重質量而非數量。為了創建其4月17日發佈的新冠病毒概要庫,40位科學家仔細梳理大量的論文,精選了涉及8個類目的80篇論文,比如疫苗研究和藥物干預等,並對每個類目進行了精編。

△資料圖

格拉博夫斯基教授表示,這項工作的重點是研究人類的論文,潛在讀者主要是醫療保健工作者和政策制定者,當然也有科學研究者。「我們希望能夠藉此填補空白,因為已經存在的資料庫包括了如此多的信息,但是這些研究並沒有很好地被分類。」這個團隊在新冠病毒概要庫中排除了大部分論文,因為他們只選取需要的評論、保護措施、模型類研究,並非原始的發現類論文。

有些人擔心論文的質量,因為很多科學家已經發佈了他們的預印本,但這些預印本並沒有得到同行的評審。據加西亞教授的研究顯示,這些預印本只是初稿,由一小部分為趕製新冠論文的研究者寫就。截至4月14日,在其審查的1.1萬篇新冠論文中,約80%出現在了參考期刊上,其中一些以預印本的形式出現。

某種程度上,這個數據也反映出,論文發表機構需要加速同行評審過程和出版計劃。根據拉德堡德大學的塞吉·霍巴赫統計,自從疫情爆發後,14家醫學期刊發佈了大部分關於新冠的論文,從提交論文到發表,周期大約為60天。「一些人擔心,還未發表的論文也在排隊中了,是否這樣的快速發表可能會讓研究質量為此買單。」霍巴赫在一篇4月18日發表於bioRxiv的預印本中如此寫道。

現在去檢測那些已發表論文的質量還為時過早,因為新冠疫情目前仍然在發展中。但加西亞的團隊發現,還有一種方法能夠檢測論文的影響力:社交平台的引用數據。根據Altmetric.com的研究數據,今年新冠論文在社交平台上的討論量已經是2019年前五月所有科研論文的十倍了。其中,談論量最高的12篇科研論文全部是關於新冠病毒的。

Altmetric.com的數據是基於對推特、臉書和其他社交平台的數據來源分析。科學家們經常在推特上測試他們各自的研究成功的反饋,這也是自媒體時代的一種自測方式。

建立工具雖急迫,可也需要人性化

為了釐清這海量的論文,很多團隊都在尋求計算機的幫助。白宮就求助於數據科學家們來研究分析CORD-19設置的工具,目的是幫助研究者回答十個由美國國家科學院和世界衛生組織提供、與流行病相關的問題。超過1500個項目在谷歌雲開發的在線機器學習研究者平台Kaggle上被發佈。

△資料圖

最早得出結果的是「人工智慧論文概要」的數據工作。通過利用演算法工具,研究者們將783篇關於新冠病毒的論文分為17個大類,然後每個話題建立一個網頁呈現研究成果。東弗吉尼亞醫學院的免疫學家塔亞·瓦西姆是該項目的主要研究員之一。他介紹稱,比如關於心臟病患者由於新冠病毒致死的分析,使用者通過檢索平台,立馬就能從很多論文中得到這個OR值,還能點擊論文的文本來看到更多的內容。

自從4月10日上線之後,這個工具已經提取了超過12.2萬頁論文。然而演算法不能總是提取出最精確的數據,瓦西姆表示,醫學學生和志願者們必須要再次核對論文來保證準確率。

還有一個挑戰是如何讓搜索工作更加人性化。墨爾本大學計算機語言學者卡莉·威斯布爾表示。「直到目前,使用端的人仍然不能理解該如何使用這個工具。」雖然數據工程師已經花費了超過20年時間來開發搜索工具,但在幫助用戶探索文章內容的微調方法上卻仍然落後。

華盛頓大學數據科學家賈維·韋斯特和同事們一起研發一個名為SciSight的搜索工具,這個工具以使用者體驗為主,可以更好地讓人們檢索新冠論文。SciSight上周才剛剛發佈,創建了多個主題來幫助人們快捷地找到自己需要的東西。

儘管已經研發出了不少搜索工具,但是一大半科研人員仍然表示自己尚未聽過任何類似的工具。還有一些人表示自己沒有時間去嘗試這些工具。