Kaya na gumawa ng malaking AI model ng China nang hindi gumagamit ng Nvidia chips. Ngayon naman, natutunan ng OpenAI kung paano magpaandar ng AI gamit ang mas kaunting Nvidia chips, at halos kalahati ang nabawas sa gastos sa pag-run ng models nila. Pero kahit ganon, tumaas pa rin ang stock ng Nvidia.
Medyo nakakagulat ‘yan. Isa ang OpenAI sa pinakamalalaking customer ng Nvidia (NVDA). Pero kahit babawasan na nila ang pangangailangan sa chips, tumaas pa rin ang stocks ng Nvidia.
Dalawang Paraan Paano Nagbawas ng Gastos ang OpenAI
Unang paraan, software. Ayon sa report ng The Information, nagawa ng mga engineer ng OpenAI na bawasan nang halos kalahati ang inference costs gamit ang bagong optimization methods. Hindi pa ine-explain ng OpenAI yung technical details nito.
Dahil dito, mas konting Nvidia chips na lang ang kailangan para sa ilang parte ng ChatGPT traffic. Maaari din nilang babaan ang presyo o taas-taasan ang usage limits ng users.
Pangalawang paraan, hardware. Noong June 24, nag-launch ang OpenAI at Broadcom (AVGO) ng Jalapeño – unang custom chip ng OpenAI. Sabi nila, base sa mga unang test, mas maganda ang performance per watt nito kaysa sa mga top chips ngayon, at nagawa nila ang design nito sa loob lang ng siyam na buwan.
Target na magamit ilang sa mga unang chips na ito at gigawatt scale pagdating ng end ng 2026, at kasosyo rito ang Microsoft. Pero, Nvidia pa rin ang ginagamit ng OpenAI bilang main hardware para sa models nila, kahit may partnership na sila sa Broadcom chips.
Lumalaban ang Mga Big Tech Para sa Sarili Nilang Chips
Hindi lang OpenAI ang gumagawa nito. Simula 2016, may sarili na ring tensor processing units ang Google, at nag-follow din ang Amazon. Sabi ng research firm na TrendForce, estimate nila na aabot sa 27.8% ng AI server shipments sa 2026 ang gawa sa ASIC-based systems — pinakamataas mula 2023.
Ayon sa bilang ng TrendForce, mas bibilis ang pag-grow ng custom chips kaysa sa Nvidia GPUs for the first time. Suppliers tulad ng Broadcom at Marvell ang naging key players sa paggawa ng mga custom chips.
Pati sa China, ginagatungan ng sanctions ang trend na ito. Ang Meituan, nagtrain ng 1.6 trillion parameter LongCat-2.0 model gamit ang mga domestic chips ng China — walang kahit anong Nvidia hardware involved.
Bakit Patuloy ang Pagtaas ng Nvidia Stock?
Totoong may threat, pero malinaw na ang mga numero. Tumaas nang halos 2% ang Nvidia stock noong June 30 at halos umabot na sa $4.8 trillion ang halaga nito. Pinakita ng pinakabagong financial results na tumaas ng 75% ang data-center revenue hanggang umabot sa record na $62.3 billion sa isang quarter lang.
Ang main pressure ngayon ay sa inference, hindi sa training. Sa training ng mga models, si Nvidia pa rin ang dominant dahil sa CUDA software nila, na gamit ng developers simula pa 2006. Hirap talunin ng custom chips ang flexibility na ‘yun.
Pinipilit ding depensahan ng Nvidia ang inference layer na sinasabing nagiging weaker na sila. Sa GTC, sinabi nilang ang parating na Rubin platform nila ay bababa ng hanggang sampung beses ang inference cost per token kumpara sa Blackwell. Kapag mas mura ang inference, mas tumataas din kadalasan ang usage at kabuuang compute.
Pero hindi pa rin kumbinsido lahat. May ilang investors na lumipat na sa mga kakumpitensiyang chip stocks dahil naniniwala silang lalala pa ang shift sa inference chips. Pero kahit walang bentang China na kinuwenta ang Nvidia para ngayong quarter, matindi pa rin ang demand sa chips nila.
Sa ngayon, lahat halos ng ginagawa nilang chips ay nabebenta agad. Ang tunay na test dito: gaano kabilis ba kayang balewalain ng mga malalaking customer nila ang Nvidia bago pa lumaki lalo ang market?









