我想做件瘋狂的事情,把風投投資專案中對被投企業的核心條款透明化和結構化,並用資料化的方式來分析和呈現。

首先說,為什麼想做這件事情。因為不斷有朋友來問我如下類似的問題:他的投資合同中有Drag-Along,這個條款啥意思;投資人告訴他不要緊,這是業界行規,所有人都要籤。還有如下類似的:有個投資人想用上一輪融資估值x%折的價格買他的老股,並告訴這是業界最好的條款之一。我知道從法律或者從金融的角度有自己的解釋,但是從做資料分析的角度,就可以有另外的解釋辦法:找到足夠大樣本的投資合同,把其中核心的條款結構化,做好統計分析呈現出來;是不是業界最好、是不是業界規則,就一目瞭然了。這就是讓最冰冷的數字說話。

其次說,為什麼瘋狂。第一,收集到足夠大樣本的Termsheet或者投資協議,是一件很難的事情,但這個專案會把樣本做到幾百個並橫跨2007-2015年。第二,法律到目前為止仍是幾樣較難被機器代替的服務,無論是用Deep Learning還是NLP,都很難把這些合同結構化和理解清楚;所以只能上人工來閱讀,而且一般的運營小妹讀不懂這些中英文夾雜的合同。第三,投資人aribitrage的一大來源就是資訊不透明,這必將極大打破資訊不透明,得罪人脈無數。(逗逼地說,不知道這個專案能不能扯上透明化計算?)

但是考慮到這是件對創業者無比有意義的事情,但願以後所有人可以揣著明白去籤合同並拿到投資款。因此還是決定去嘗試,並且根據後續的反饋,會考慮把它做成一個持續更新的資料服務。

因為這件事情很有挑戰,不能一蹴而就,所以先做預告,然後逐步放出結果,會把它做成一個系列釋出在知乎專欄。

以下是示例,資料的收集、統計和分析仍在進行中,希望大家提意見。

關於“排他期”的統計(exclusivity):下圖反映了各個專案中排他期的分佈,平均值為62。4天,中位置為60天,約70%專案的排他期都在60天以內。

用資料化的方式解析投資條款(預告片)

用資料化的方式解析投資條款(預告片)

關於“贖回條款”的統計(redemption):有90%的專案要求了贖回條款,平均的贖回IRR為12。4%。

(專欄一會盡快放出)