您現(xiàn)在的位置是:首頁 >市場 > 2021-04-19 10:31:22 來源:
使用轉(zhuǎn)錄和AI馴服充滿視頻和音頻的世界
要求任何記者說出他們真正討厭的工作的一部分,大多數(shù)人會告訴你,這就是我現(xiàn)在正在做的事情 - 轉(zhuǎn)錄。
你不遺余力地講述故事,但是你必須得到你剛剛收集到印刷頁面上的金色字樣。只有一種方法可以做到這一點,而這就是轉(zhuǎn)錄 - 這是一項繁瑣的工作,它可以幫助你找到那些你努力工作的單詞。
有許多公司提供轉(zhuǎn)錄服務,但關鍵問題是準確性。
現(xiàn)在Trint是一家由經(jīng)驗豐富的許多外國戰(zhàn)爭老手所擁有的公司,他聲稱已經(jīng)開發(fā)出一種方法,可以準確地將這些錄制語音的文字直接打印到打印頁面上。用戶包括一些最大的媒體名稱,如紐約時報,ABC新聞,湯森路透,AP,ESPN和BBC Worldwide。
據(jù)報道,Trint首席執(zhí)行官Jeff Kofman解釋了它是如何完成的。
網(wǎng)易科技:你是怎么第一個得到Trint的想法的?
科夫曼:我稱自己是偶然的企業(yè)家。我作為一名廣播記者花了三十多年的時間 - 一位來自40多個國家的外國記者。
實際上,我正在組建一個全球新聞計劃并遇到一些在口語成績單上做過有趣工作的開發(fā)人員。我說我花了一生的時間來抄寫采訪,演講和會議,但隨著演講到文本越來越好,為什么不能為我做繁重的工作呢?他們不知道這個瘋狂的記者是誰,但這個有趣的想法浮出水面。
這是那些燈泡時刻之一。我們想,為什么以前沒有這樣做過?這是在2013年左右,我們在2014年開始了Trint。我希望我可以說我是一個偉大的遠見者,但我不知道技術是在這個偉大的時刻,當演講到文本剛剛開始向前和上升階段。
如果你在兩年前嘗試過,那就失敗了。兩年后,你會關注我們。如果你想到海洋上的沖浪者正在尋找形成的波浪,我們就會得到它正在形成的波浪。
我認為這是因為我遇到了問題。如果你沒有住在問題中,那么你實際上并不知道有問題。我偶然發(fā)現(xiàn)它,但我可以看到我們原來的三個開發(fā)人員都在他們的東西上。回來的結果比我預期的要好。
我們的想法是,我們將文本 - 機器生成的成績單和源音頻 - 與口語單詞對齊并準確地達到毫秒級,這樣你就可以像卡拉OK那樣跟隨它,然后我們必須找到一種方法來糾正它。這就是真正有趣的地方。
我們所做的是,我們提出了將文本編輯器(如Word)合并到音頻 - 視頻播放器并創(chuàng)建一個具有兩個非常不同功能的工具的想法。
這就是勝利的地方,我記得對這些家伙說 - 而且我認為他們認為我有點瘋狂 - 這就是未來。要么我們聚在一起讓這件事情發(fā)生,要么我們將在幾年內(nèi)走進咖啡館,有人會開始研究一些我們剛剛設想的軟件。
我說,我不會讓這種情況發(fā)生。這實際上是說世界需要使口語可被發(fā)現(xiàn)。我們是一個視頻,音頻,播客和YouTube的世界。我們不再通過書面信件,通過文字說話了。我們通過音頻和視頻錄制講話。他們不可搜索。打印使它們可以搜索。
我們在這里得到一個時間表。你什么時候開始的?
好吧,在2014年初,它開始發(fā)芽,我們在14年秋天建立了公司,我們真的開始建設。我在報紙,電視,廣播,網(wǎng)上安排了一些記者朋友的電話,我戴上了我的記者的帽子,并與世界各地的十幾個團隊一起做了這件事,以便工程師能夠理解問題所在。我說,告訴我你怎么做筆記,你怎么找到內(nèi)容,錄音。每個人都說:“Omigod我討厭抄錄,這是我工作中最糟糕的部分。它總是一樣的 - 聽,停,打字;聽,停,打字。如果你能給我們一條捷徑,你就會表現(xiàn)出奇跡”。