Czy AI może zastąpić VC? Trzy eksperymenty

May 05 2023
Obecnie dużo słyszymy o tym, jak generatywna sztuczna inteligencja, szczególnie duże modele językowe, takie jak ChatGPT, może zastąpić pracowników umysłowych. A inwestorzy venture capital są, przynajmniej w dużej części swojej pracy, pracownikami umysłowymi.

Obecnie dużo słyszymy o tym, jak generatywna sztuczna inteligencja, szczególnie duże modele językowe, takie jak ChatGPT, może zastąpić pracowników umysłowych. A inwestorzy venture capital są, przynajmniej w dużej części swojej pracy, pracownikami umysłowymi. Które części pracy VC mogłaby przejąć sztuczna inteligencja?

„AI pomagająca inwestorowi venture capital”. Cztery wariacje wygenerowane przez Midjourney.

Zacznijmy od wniosku: obecna generacja LLM nie jest w stanie zastąpić (nawet bardzo młodszych) VC. Nie ma jednak wątpliwości, że narzędzia sztucznej inteligencji osiągnęły poziom dojrzałości, który może znacząco poprawić VC i podobne zawody w ich codziennej pracy, szczególnie w przypadku pierwszych szkiców żmudnych zadań.

Aby zbadać, co jest możliwe teraz (w maju 2023 r.), przeprowadziłem trzy eksperymenty, aby dowiedzieć się, jak rozszerzyć typowe zadania VC:

  1. Pisanie notatek inwestycyjnych
  2. Przeprowadzanie analiz rynku
  3. Robię intra

Kiedy VC lubią firmę i poważnie rozważają inwestycję, piszą notatkę inwestycyjną. To wielostronicowy dokument, który przedstawia mocne i słabe strony startupu oraz zawiera rekomendacje dla komitetu inwestycyjnego. Napisanie takiej notatki to ważne zadanie analityczne, ale też żmudne, ponieważ zebranie wszystkich istotnych punktów danych to sporo ręcznej pracy.

Mały program w Pythonie, który napisałem na potrzeby tego eksperymentu, jest w stanie pobrać prezentację PDF dla startupu w takiej postaci, w jakiej jest, aby automatycznie wygenerować 7-8-stronicową notatkę inwestycyjną ze wszystkimi niezbędnymi szczegółami — z wyjątkiem ilustracji i tabel w tym momencie. Wcześniejsza wersja oparta na GPT-3 konsekwentnie popełniała wiele błędów, ale wersja GPT-4 jest wyjątkowo niezawodna. Czasami jest zdezorientowany przez naprawdę skomplikowane slajdy, ale większość szczegółów jest poprawnie odczytywana, nawet ze skomplikowanych tabel numerycznych. Rezultat z pewnością nie jest doskonały i kompletny, ale jest więcej niż wystarczająco dobry jako pierwszy szkic.

Boisko Edurino

Jako przykład, oto kilka wyników opartych na oryginalnym zestawie prezentacyjnym z naszej spółki portfelowej b2venture Edurino . Modelka doszła do bardzo pozytywnych wniosków. Spoiler: My w b2venture ostatecznie zainwestowaliśmy, więc model jest właściwy. Poniższe zdjęcia to nieedytowane wyniki utworzone przez model, zredagowane w celu zachowania poufności.

Następny rysunek to monit o model, który szczegółowo opisuje, czym jest notatka inwestycyjna i co robi każda sekcja. Aby uzyskać użyteczne wyniki z GPT-4, konieczne jest staranne opracowanie tych podpowiedzi. Ten konkretny jest prawdopodobnie wersją 20 lub mniej więcej.

Ponieważ GPT-4 jest nadal dość powolny i drogi, zajmuje to około 5 minut i kosztuje aż 1,50 USD. Niezbyt straszne jak na coś, co zajęłoby kilka godzin ręcznie.

Analiza rynku

Analiza sektora rynku i różnych jego uczestników to jedno z najważniejszych, ale i najbardziej czasochłonnych zadań w venture capital. Większość dzisiejszych rynków jest bardzo dynamiczna i hałaśliwa, więc często trzeba spojrzeć na dziesiątki firm (zarówno start-upów, jak i obecnych), aby zrozumieć, co się dzieje. Samo znalezienie tych wszystkich firm może zająć kilka dni.

Jak więc sztuczna inteligencja może pomóc? Zainspirowany niektórymi ostatnimi osiągnięciami w zakresie autonomicznej sztucznej inteligencji (takimi jak framework AutoGPT ), stworzyłem prototyp, który jest w stanie opracować pierwszy szkic analizy rynkowej tylko na podstawie nazwy firmy — zazwyczaj startupu, w który zamierzasz zainwestować — oraz kilka ogólnych słów kluczowych opisujących sektor. Następnie prototyp przeprowadza niezależną analizę rynku.

Wynik jest dość niezwykły. Używam tutaj naszej istniejącej spółki portfelowej b2venture Decentriq jako przykładu, ponieważ jej rynek jest bardzo dynamiczny, niełatwy do zrozumienia dla osób z zewnątrz i składa się z mieszanki start-upów i dużych operatorów zasiedziałych.

Prototyp oparty na GPT-4 może w pełni automatycznie zidentyfikować kilkadziesiąt odpowiednich firm, zarówno bezpośrednich, jak i pośrednich konkurentów. Może napisać krótkie podsumowanie rynku jako wprowadzenie. Co najbardziej zaskakujące, może wymyślić odpowiednie czynniki różnicujące i odpowiednio uszeregować firmy, aby stworzyć typową macierz konkurencyjną 2x2. Wszystko to zajmuje około pół godziny i kosztuje około 2–3 USD opłat API.

Lista konkurentów uszeregowana według podobieństwa do firmy, którą analizujemy
Podsumowanie rynku
Matryca 2x2 (dane z GPT-4, wizualizacja w Exelu)

Oczywiście jest to tylko punkt wyjścia do prawdziwej analizy rynku. Eksperci będą mieli wiele komentarzy i różnych punktów widzenia na te wyniki.

Dwa główne wąskie gardła: sztuczna inteligencja może analizować tylko informacje publiczne, które mogą być dokładne lub nie. A na złożonych rynkach często nie jest łatwo zrozumieć subtelne niuanse między firmami i podsektorami (oczywiście jest to również wyzwanie dla analityków).

Jak to działa? Prototyp wykorzystuje GPT-4 jako zaplecze analityczne, ale także sporo sztuczek Pythona do pozyskiwania i przetwarzania surowych danych.

  1. System przeprowadza kilka wyszukiwań w Internecie, aby zidentyfikować przydatne strony internetowe opisujące branżę. GPT-4 przewiduje trafność każdej strony, aby dalszy proces mógł skupić się na najbardziej przydatnych treściach.
  2. Następnie GPT-4 analizuje te strony i identyfikuje odpowiednie firmy na podstawie treści, wraz z opisem i rankingiem trafności dla każdej firmy.
  3. System wyszukuje status finansowania dla każdej firmy z hurtowni danych zawierającej dane Crunchbase (z płatnego Crunchbase API)
  4. Następnie system prosi GPT-4 o napisanie podsumowania rynku i przedstawienie nieprzetworzonych danych dla macierzy 2x2.

Wspaniale jest również przeprowadzać wstępne rozmowy ze startupami, które mają już pierwsze solidne zrozumienie obecnych warunków rynkowych — stworzone przez asystenta ds. badań rynku w ciągu kilku minut w tle. Najważniejszymi aspektami, które VC chcą zrozumieć na wczesnym etapie, jest to, jak dany startup się wyróżnia. Każdy dodatkowy wgląd w jego rynek jest zatem bardzo przydatny w tej dyskusji.

Eksploracja sieci

VC często się przedstawiają. Często spółki portfelowe chcą zostać przedstawione potencjalnym klientom, doradcom lub potencjalnym inwestorom w przyszłych rundach finansowania. Tworzenie tych wstępów to jeden z najlepszych sposobów, w jaki VC mogą pomóc.

Brzmi to dość łatwo, ale w rzeczywistości nie jest trywialne. Jeśli jesteś podobny do mnie, masz tysiące kontaktów na LinkedIn i w innych miejscach, od bliskich przyjaciół po osoby, z którymi rozmawiałem przez dwie minuty na konferencji w 2005 roku. I oczywiście ludzie ciągle zmieniają pracę, więc zastanawianie się, kto może być teraz na odpowiednim stanowisku nie jest łatwe.

Większość profesjonalistów ma obecnie w miarę aktualny profil na LinkedIn, więc to jest punkt wyjścia. Ale niestety funkcje wyszukiwania LinkedIn są dość ponure, co sprawia, że ​​znalezienie odpowiedniej osoby jest nadal trudne.

Aby moje kontakty z LinkedIn były łatwiejsze do przeszukiwania, użyłem generatywnej sztucznej inteligencji i wyszukiwania semantycznego. wykonałem następujące czynności:

  1. Zeskrob moje kontakty z LinkedIn za pomocą jednego z kilku łatwo dostępnych skrobaków. To wciąż żmudny proces (szkoda, że ​​LinkedIn nie ma interfejsu API), ale spełnia swoje zadanie.
  2. Rozszerz najważniejsze profile o pełne, wygenerowane przez GPT-4 podsumowanie całego profilu. Jest to stosunkowo kosztowne i powolne, więc zrobiłem to tylko dla najważniejszych profili. W pozostałej części użyłem tylko tytułu stanowiska, firmy i nagłówka.
  3. Twórz osadzania (wektorowe reprezentacje tekstu profilu) za pomocą interfejsu API osadzania OpenAI .
  4. Zapisz osadzenie profilu w bazie danych wektorowych. Wypróbowałem Pinecone i FAISS , które dały porównywalne wyniki. Dzięki temu profile można natychmiast przeszukiwać w sposób semantyczny, tzn. nie musi być pełnego dopasowania słów kluczowych, ale baza danych może identyfikować koncepcje podobne do tego, o co prosisz.
  5. Następnie napisałem (a raczej poprosiłem GPT-4 o napisanie, co zrobił w kilka sekund) małą aplikację internetową, która pozwala mi przeszukiwać bazę danych.

To nie jest idealne. Dość często nie jest jasne, dlaczego wyszukiwarka podaje wynik, który wydaje się nie mieć wiele wspólnego z pierwotnym zapytaniem. Ale odfiltrowanie tego szumu jest znacznie łatwiejsze niż znalezienie odpowiednich ludzi, więc nadal jest to ogromna oszczędność czasu. Z drugiej strony, wciąż widzisz profile osób, o których być może nigdy nie pomyślałeś, ale które mogą być istotne w bardziej pośredni i kreatywny sposób.

Oczywiście generatywna sztuczna inteligencja może również pomóc w napisaniu tekstów wprowadzających do osób, z którymi chcesz się skontaktować. Używam do tego narzędzi naszej firmy portfelowej TextCorte x. Ich produkt nowej generacji będzie w stanie jeszcze lepiej naśladować mój styl. Ale to zdumiewające, jak asystent Zeno TextCortexa już prawidłowo podaje fakty, o których nawet nie wspomniałem.

Kilka rzeczy, których się nauczyłem

Większość z nas bawiła się już z ChatGPT i podobnymi narzędziami i prawie na pewno doświadczyłeś tych magicznych chwil, kiedy maszyna zrobiła coś, czego się nie spodziewałeś.

Ale każdy, kto zajmuje się technologią wystarczająco długo, wie: od fajnego demo do czegoś, z czego ludzie będą regularnie korzystać i co naprawdę poruszy igłę w biznesie, jest długa droga.

Moje eksperymenty pokazały, że GPT-4 (jako obecnie najbardziej zaawansowany model językowy) jest naprawdę dobry w kilku rzeczach:

  • Podsumowanie tekstu w bardzo inteligentny i przede wszystkim precyzyjny sposób
  • Wydobywanie informacji z tekstu nieustrukturyzowanego
  • Opracowywanie pierwszych projektów produktów
  • Znajdowanie wzorców
  • Dobrze znany problem halucynacji — model tworzenia czegoś z powietrza — jest problemem na kilku poziomach. Nawet jeśli powiesz GPT-4, aby po prostu trzymał się faktów, które dostarczasz, od czasu do czasu wymyśli coś innego. A nawet bardzo jasne instrukcje — takie jak „nie numeruj firm, które wyodrębniasz z tego tekstu” — są ignorowane w około 5% przypadków. Nie jest jasne, jak można to idealnie kontrolować.
  • Obecne modele mają dość ciasny „limit tokenów”, który ogranicza rozmiar wejść i wyjść. Na przykład GPT-4 ma obecnie limit tokenów 8 000, co przekłada się na około 4–5 000 słów zarówno na wejściu, jak i na wyjściu. To nie jest tak źle, ale oznacza, że ​​nie można podawać dużych dokumentów. W praktyce oznacza to, że często musisz dzielić dane wejściowe na mniejsze części, co stwarza własne problemy związane z utratą kontekstu.
  • Śmieci na wejściu, śmieci na wyjściu: Dotyczy to również modeli językowych. Gdy korzystasz z zewnętrznych źródeł danych, takich jak wyszukiwarki internetowe, bardzo ważne jest dokładne kontrolowanie tego, co podajesz jako dane wejściowe. Aby uzyskać właściwe wyniki, potrzeba wielu ulepszeń prowadzonych przez człowieka.
  • Niedawny szum wokół frameworków „opartych na agentach”, takich jak AutoGPT, może sugerować, że modele AI mogą już działać niezależnie. Z mojego doświadczenia wynika, że ​​jest to dalekie od prawdy. Złożone zadanie, takie jak analiza rynku, nadal wymaga starannego przygotowania skryptu, aby uzyskać użyteczny wynik. Jednak z pewnością istnieje droga do bardziej autonomicznych systemów.