Hoe ziet een super-app in het AI-tijdperk eruit?


Geschreven door | Wu Xianzhi

Redacteur | Wang Pan

Bron: Photon Planet

Afbeeldingsbron: gegenereerd door Unbounded AI-tool

Op 25 mei werd in Guangzhou de jaarlijkse Baidu Vientiane-conferentie geopend.

He Junjie, Senior Vice President van Baidu Group en General Manager van Baidu Mobile Ecosystem Group (MEG), gaf tijdens de bijeenkomst een uitgebreide introductie en interpretatie van veel nieuwe veranderingen in het mobiele ecosysteem van Baidu. Hij zei dat Baidu de manier van denken en concepten van AI-native applicaties zal cultiveren op basis van grootschalige modeltechnologie, elk product in het mobiele ecosysteem zal reconstrueren en een nieuw ecosysteem zal opzetten in het nieuwe tijdperk.

Op de conferentie werden achtereenvolgens producten onthuld, waaronder “AI Partner” en de nieuwe startpagina van de Baidu-app “One Person One World”.

Productupdates brengen niet alleen nieuwe ervaringen met zich mee, maar ook de opkomst van AI-native applicaties geeft aan dat kunstmatige intelligentie alle producten in het mobiele tijdperk zal reconstrueren, zoals Baidu Search, Baidu App, Baijiahao, Haokan Video en andere producten die in ontwikkeling zijn en hebben nog niet “hun gezicht laten zien” AI-native nieuwe applicatie “Nieuwe app”.

Aangezien Baidu zowel aan de makerskant als aan de gebruikerskant van deze conferentie veel updates heeft gemaakt, zei He Junjie tijdens de interne communicatiebijeenkomst half grappend dat de jaarlijkse conferentie de snelheid van technologische iteratie niet eens kan bijhouden.

Zoals hij op de Conferentie van Vientiane zei, is het grote model om AI “groter” te maken, dus de reconstructie van het mobiele ecosysteem is deze keer om AI kleiner en specifieker te maken, zodat het echt voor iedereen toegankelijk kan zijn.

AI reconstrueert het mobiele ecosysteem

Er zijn slechts een handvol applicaties op nationaal niveau en er zijn niet veel applicaties die een continue positieve groei behouden, waaronder de Baidu App die gedurende verschillende opeenvolgende kwartalen een sterk groeimomentum heeft behouden.

Uit het financiële rapport blijkt dat vanaf het eerste kwartaal van 2023 de maandelijkse actieve gebruikers van de Baidu-app 657 miljoen hebben bereikt, een stijging op jaarbasis van 4%.

Tegenwoordig, wanneer gebruikers Baidu openen, is het niet langer zo eenvoudig als “zoeken”, maar omvat het alomvattend bekijken, zoeken, luisteren, vragen en kopen, die ook de vijf kernscenario’s van de Baidu-app vormen. Het is juist vanwege voortdurende doorbraken in kernscenario’s dat de Baidu-app een hoge groei kan aanhouden, zelfs wanneer het internet al over zijn hoogtepunt heen is.

“Kijken” is het snelst groeiende segment van alle scènes.

Baidu AI biedt videomakers een groot aantal nieuwe tools en ondersteuning voor inhoud, waardoor het platform aanzienlijk beter in staat is om inhoud van hoge kwaliteit te leveren. In combinatie met volledige scenario-interoperabiliteit kunnen gebruikers een meeslepende ervaring in elke scène binnengaan, waardoor zowel levering als vraag gesynchroniseerd. Vorig jaar steeg het aantal Baidu App-videogebruikers met 31% en de groei van live-uitzendingen meer dan verdubbeld.

Het grootschalige model verbetert de ervaring van video-aanbevelingen. De Baidu-app kan nu massale gebruikers, multi-scenario en cross-time en ruimte gedragssignalen combineren om het begrip van de interesses en relaties van gebruikersinhoud te versterken, om aanbevelingen nauwkeuriger te doen .

Elke toepassing op nationaal niveau staat voor een enorme uitdaging: hoe zich aan te passen aan de behoeften van duizenden mensen. Om zich aan te passen aan een breder scala aan mensen, vooral mensen met slechte vaardigheden op het gebied van het gebruik van mobiele telefoons, zoals ouderen, heeft Baidu App intelligente ontwerpen gemaakt, zoals lettertypen, videovenstergroottes en schuifmethoden.

Bovendien zijn er veel aanpasbare opties, zoals de startpagina met grote afbeeldingen, de startpagina van de video en de nieuwe startpagina. Nadat de inhoud duizenden mensen is, kan Baidu nu diepere aanpassingsservices bieden.

Onder de iteratie met dubbele mogelijkheden van “semantische ophaaltechnologie + groot taalmodel”, zal de fusie van zoeken en pushen nauwkeuriger en sneller kunnen reageren op de behoeften van gebruikers, en voor het inzicht van de zoekgeest van gebruikers kan Baidu-zoeken verder voldoen aan de potentiële behoeften van gebruikers, om een ​​zoektocht, tevredenheid op lange termijn te realiseren.

Anders dan “kijken”, zijn er veel scènes die overdag moeten worden “beluisterd”, zoals ‘s ochtends wassen, autorijden en woon-werkverkeer, buitensporten, enz. Audiocontent heeft onvervangbare voordelen. Dit jaar heeft Baidu App een grote upgrade ondergaan op het gebied van “luisteren”, en inhoud in de vorm van afbeeldingen, tekst, video, enz. kan in audiovorm worden gepresenteerd. Tot nu toe is de zendtijd per hoofd van de bevolking van Baidu App-gebruikers met 25% toegenomen.

Mensen zijn er al lang aan gewend om Baidu-zoekopdrachten te gebruiken om problemen op te lossen, maar zoeken kan niet alle problemen oplossen. Wanneer gebruikers bijvoorbeeld Baidu doorzoeken op juridische, medische, levens- en andere gebieden, is het moeilijk om geschikte antwoorden te vinden in de hele zoekopdracht op internet. Op dat moment nam Baidu’s “Stel een vraag” de behoeften over die niet konden worden gedekt door zoeken.

Vertrouwend op Baidu’s opgebouwde kennisverticalen en makers in professionele velden, kan Baidu App gebruikers efficiënt verbinden met “probleemoplossers” en één-op-één real-time online adviesdiensten bieden. Door juridisch advies als voorbeeld te nemen, is de Baidu-app het grootste platform voor juridische adviesdiensten met gebruikers geworden. De inhoud van juridische vragen en antwoorden op het platform heeft de 80 miljoen overschreden, met 20 miljoen gebruikers die elke dag bezoeken, en maar liefst 20.000 professioneel gecertificeerde advocaten vestigden zich om vragen te stellen Vraag om service.

Efficiënte respons heeft geleid tot een substantiële toename van de gegevens met betrekking tot “vragen”. Het is duidelijk dat de Baidu-app elke dag meer dan 5 miljoen consultaties initieert via het platform, een stijging van 155% op jaarbasis; in het afgelopen jaar bedroeg het aantal betaalde consultaties meer dan 200 miljoen.

Hoewel de vier kernscenario’s van kijken, zoeken, luisteren en vragen aan de behoeften voldoen, zijn er nog steeds nogal wat ‘koop’-situaties, zoals het bestellen van een mooie jurk tijdens het bladeren door video’s en het bekijken van live-uitzendingen, en het plaatsen van een bestelling voor reisdiensten bij het zoeken naar een bestemming, enz., is het aantal leveringsopdrachten dat wordt getriggerd door inhoud aanzienlijk toegenomen.

He Junjie zei: “Baidu heeft zijn eigen begrip van e-commerce en zijn houding zal meer open zijn.” In het afgelopen jaar steeg de totale GMV van Baidu e-commerce met 152% op jaarbasis, het aantal maandelijkse transactiegebruikers stegen met 100%, en het terugkooppercentage steeg met 25%.%, het aantal handelaren dat Baidu e-commerce betreedt, steeg met 53%, wat niet alleen aantoont dat Baidu’s versterking van de vijf kernscenario’s een gesuperponeerd effect heeft, maar we zien ook het potentieel van “zoeken, pushen en winkelen” geïntegreerde slimme e-commerce.

Opgemerkt moet worden dat gebruikers een hoge terugkoop en loyaliteit hebben bij het winkelen in Baidu e-commerce.Momenteel zijn veel handelaren bereid om Baidu als een zakelijke positie te gebruiken.

Vergeleken met de potentiële energie die door AI in de mobiele ecologie is gereconstrueerd, is de toekomst die door Baidu op de Conferentie van Vientiane werd onthuld, interessanter.

Waarom moet AI native zijn?

De toekomst die Baidu op de Vientiane-conferentie noemde, is een AI-native applicatie “Nieuwe app”, gebaseerd op het vermogen van Wenxin Yiyan.

Op basis van grote modelmogelijkheden of nieuwe applicaties zijn niet nieuw, wat nieuw is, is AI native. In de hedendaagse mainstream mobiele internet-ecologie hebben AI-toepassingen zich gedifferentieerd in twee landingspaden: één is gebaseerd op het volwassen besturingssysteem en de API-constructie in het mobiele internettijdperk, en de andere is om het oorspronkelijke pad van AI te verkennen.

De voor- en nadelen van de twee paden liggen voor de hand: het eerste pad is natuurlijk relatief eenvoudiger, namelijk het verbinden van AI-producten met de API-interface van mobiele applicaties en gebruikers “lenen” om toegang te krijgen tot AI-applicaties en hun functies, terwijl het tweede pad Regels zijn veel moeilijker, vooral als er tegenwoordig geen duidelijke definitie is van AI-native.

Zelfs als een applicatie bijvoorbeeld verklaart dat het “AI-native” is, om gebruikers te bereiken, is de drager hoogstwaarschijnlijk een besturingssysteem waarmee we bekend zijn, of het nu Windows, iOS of Android is.

Maar dit is voor ons geen reden om het verkennen van de echte AI-native op te geven.

Je kunt verwijzen naar het geval van nieuwe energievoertuigen. In de nieuwe energievoertuigindustrie is er zo’n ogenschijnlijk “onopvallende” categorie. Het is de “olie naar elektriciteit” die traditionele autobedrijven toepassen wanneer ze de nieuwe energie-industrie betreden.

Het fundamentele doel is om de trend van kostenbeheersing te volgen, maar zonder het exclusieve ontwerp van nieuwe energie zijn er veel nadelen op het gebied van batterijduur, veiligheid en voertuigprestaties, die geleidelijk aan worden geëlimineerd in de huidige Chinese markt.

Er is ook een klinkend soortgelijk geval in AI-toepassingen – nieuwe bing uitgerust met ChatGPT.

De fijnheid ervan is na vele dagen gebruik door vrienden over de hele wereld onthuld.Het meest bekritiseerde punt is dat nieuwe bing wordt beperkt door de logica van zoekmachines. Vanwege de noodzaak om de potentiële juridische risico’s van de inhoud die door de zoekopdracht wordt gegenereerd, te dragen, wordt de inhoud die interactief wordt gegenereerd door nieuwe bing vaak geïntegreerd door middel van zoeken onder een bepaald mechanisme voor het filteren van inhoud, of extraheert direct de kant-en-klare informatie op de webpagina en koppelt een link.Het is een typische point-to-point logica van een tweedimensionaal vlak.

In termen van interactiviteit ondersteunt nieuwe bing geen meerdere dialoogrondes, noch kan het het proces van kunstmatige “domesticatie” zoals ChatGPT uitvoeren. Wat betreft de open API en plug-in van ChatGPT, het is zelfs nog onmogelijker op nieuwe bing.

Als Baidu AI-applicaties ontwikkelt op basis van de productvorm van het mobiele tijdperk, zelfs als we negeren dat Microsoft de prestaties van nieuwe bing na zelftesten kan beperken, zal de marktfeedback van de nieuwe applicatie waarschijnlijk vergelijkbaar zijn met die van nieuwe bing. Wat meer de moeite waard is om te bestuderen, is dat het winstmodel van zoekmachines voornamelijk bestaat uit advertenties. De gepersonaliseerde inhoud die wordt gegenereerd na toegang door AI is natuurlijk in strijd met de advertentiebusiness. Daarom volgde Google OpenAI niet volledig op toen het twee jaar geleden de GPT-applicatie ontdekte. een.

Het lijkt erop dat AI native al de route is die Baidu moet promoten, maar om AI native te doen, moet Baidu ook nadenken over bereik en gebruiksgemak. Midjourney, een AI-native applicatie die goed reageert in de markt, heeft bijvoorbeeld workflowdrempels zoals pad-kaarten, prompts en SEED-parameters die de groei van het C-end belemmeren.

In dit opzicht gaf Li Yanhong al op 10 januari op de Baidu Create-conferentie in 2022 inzicht, door Baidu’s full-stack lay-out in de chiplaag, raamwerklaag, modellaag en applicatielaag, van boven naar beneden, door technologietoename tot het algemeenheidsprobleem oplossen. Anders dan de drielaagse lay-out van de chiplaag, besturingssysteemlaag en applicatielaag in het mobiele tijdperk, is de belangrijkste van de nieuwe vierlaagse architectuur de frameworklaag, het deep learning-framework waarop de AI groot model is getraind.

Volgens de AI Grant Foundation, opgericht door voormalig GitHub-CEO Nat Friedman om wereldwijd een AI-native productmatrix te bouwen, zijn de verwachtingen voor AI-native (AI-native) producten op basis van grote modellen vaak raar en fantastisch. , bij productontwerp is het noodzakelijk dat het model “geen fouten maakt” en de kosten van gebruikersverlies veroorzaakt door het genereren van modelfouten vermindert, en de constructie van het deep learning-raamwerk is de weg naar deze oplossing.

Li Yanhong zei tijdens de prijsuitreiking van de “Baidu Pride” in 2023 dat Wenxin Yiyan vier belangrijke technologische upgrades had ondergaan in meer dan een maand van interne tests, en dat de redeneerprestaties bijna 10 keer zijn toegenomen. De realisatie van het redeneervermogen op de applicatielaag is het semantisch begripsvermogen, waardoor AI-applicaties niet langer te veel workflows nodig hebben om tot bruikbare content te komen.

Het deep learning-framework helpt AI om het vermogen van semantisch begrip te verdiepen. In het zoekveld dat Baidu probeert te ontwikkelen, verlaagt het enerzijds de workflowdrempel van applicaties zoals Midjourney; De zoekopdracht wordt een driedimensionale zoekopdracht op basis van semantisch begrip, waardoor zoeken op internet het effect kan bereiken dat vergelijkbaar is met de tool voor het ophalen van vectoren vearch.

De huidige Baidu-app kan ons vertellen “Wie is Shakespeare”, terwijl de nieuwe app van Baidu wil “spreken als Shakespeare”. Daarom moet Baidu “pure elektriciteit” doen, en het pad om de app opnieuw uit te voeren kan alleen het oorspronkelijke pad van AI volgen.

AI voor iedereen

Er zijn voldoende landingsrichtingen voor AI-toepassingen, wat ons voldoende ruimte voor verbeelding geeft, maar ook moeilijkheden met kiezen met zich meebrengt.

Volgens de AI-native applicatie-instructies van de AI Grant Foundation omvatten alleen de bestaande aanwijzingen persoonlijke assistenten, AI-sociale netwerken, creatief werk, UI-generatie, chatbot, mturk/upwork, AI-zoekopdrachten, enz. Welke is de nieuwe app?

Volgens de nieuwe app-demo op de Baidu Vientiane-conferentie omvatten de functies ten minste drie functies: persoonlijke assistent, chatbot en AI-zoekopdracht. Nieuwe app communiceerde met de presentator in de stem van acteur Huang Jingyu en herplande het schema volgens het oorspronkelijke schema, en herkende ook de lege orentekst van “geef me nog twee groene uien en laat me kroeskarper in cakes bakken” tijdens de interactie maakte Jay Chou bekend. De verborgen functie van de nieuwe app is het creëren van een “digitale kloon”, die elk beeld kan genereren op basis van stem, zoals Tu Yaya in de hitfilm “The Wandering Earth 2”, als een virtueel leven dat lang bestaat en begeleidt tijd.

Het is waar dat de demo-inhoud door de tijd beperkt was en ons niet te veel liet zien, maar in vergelijking daarmee heeft de functie van “persoonlijke assistent” veel mogelijkheden. Schemaplanning is slechts de meest elementaire toepassing, en er zijn meer diepgaande gegevensverwerking, tekstschrijven en ophalen, enz. Meer in het algemeen is het de AI-secretaris.

Dit vereist niet alleen het vermogen van AI om snel corpus op te halen en inhoud te genereren, maar ook het vermogen van AI om individuen te bereiken, geleidelijk vertrouwd te raken met individuen in de interactie en individuen te bevrijden van ingewikkelde zaken op basis van hun werk, leven, emoties en andere kenmerken Vermogen.

Nieuwe app is mogelijk geen product uit hetzelfde tijdperk als eerdere applicaties. Het is geen upgrade van de oorspronkelijke zoek-app, dit zijn twee totaal verschillende tijdperken en de nieuwe app vertegenwoordigt volledig een nieuw tijdperk. “We hopen dat wanneer het officieel wordt gelanceerd, het de aandacht van iedereen zal trekken, in plaats van een simpele optimalisatie, upgrade en iteratie. Wanneer je het opent, kunnen gebruikers voelen dat er een nieuw tijdperk is aangebroken. Dit is het doel dat we het liefst willen bereiken.” Zei Li Xiaowan.

Van het verhaal van de Vientiane-conferentie, de evolutie van Baidu-app naar nieuwe app is van het zoeken in het mobiele tijdperk naar de persoonlijke bevrijding in het AI-tijdperk, van punt-tot-punt single-point feedback naar punt-naar- oog in oog staan. Mensen hoeven niet langer het initiatief te nemen om zich aan te passen aan de zoekbox, maar om de zoektocht aan te passen aan de mens.

Wil je echter zeker zijn van de nauwkeurigheid van het model en het leergeheugen van AI, dan is de test rekenkracht en chipreserves. Of de API die de nieuwe app opent voor individuele gebruikers een klein en middelgroot model is of Wenxin, is niet duidelijk, maar het lijdt geen twijfel dat voor een nieuwe app die is gericht op een groot aantal C-end-gebruikers, de reis van demo naar landing zal veel groter zijn dan ChatGPT 3.5 naar de ChatGPT-plug-in.

In dit tijdperk zijn we getuige geweest van de geboorte van te veel revolutionaire nieuwe ideeën, zoals de opkomst van de nieuwe app, wat aangeeft dat het product de mogelijkheid heeft om terug te keren naar het origineel – de applicatie is in wezen voor mensen. Hoewel het concept van “mensgericht” herhaaldelijk is genoemd in eerdere technologische innovaties, is het beperkt door de tijd. Of het nu gaat om technologie of een winstmodel, het conflict en de tegemoetkoming aan de menselijke natuur in zijn ontwikkelingstraject blijven in tegenstellingen bestaan ​​en tegenstellingen.

Li Yanhong zei ooit dat we bewust de manier van denken en concepten van AI-native applicaties moeten cultiveren, wat vereist dat we nieuwe concepten gebruiken om elk van onze huidige producten en bedrijven te reconstrueren.

Zal AI bijvoorbeeld onze banen daadwerkelijk innemen? Terugkijkend op de vorige industriële revoluties, hoewel de geboorte van een nieuwe productiemethode sommige mensen elimineerde, creëerde het ook banen op basis van deze productiemethode en creëerde het een andere groep mensen. Wat het AI-model ons brengt, is de “reverse Turing-test”, die creativiteit bevrijdt in plaats van onderdrukt.

Of AI-native het probleem echt kan oplossen of technologie mensen echt van dienst kan zijn, moet nog worden geverifieerd, en het bereiken van gebruikers in de vorm van applicaties heeft AI niet in staat gesteld om de beperkingen van mobiele apparaten kwijt te raken. Maar wat zeker is, is dat ontwikkelaars, operators en gebruikers allemaal de oorspronkelijke denkmodus van AI moeten herbouwen, wat een keerpunt betekent voor het hele mobiele internet.

De Baidu Vientiane-conferentie is een kans voor een keerpunt. We zien dat de Baidu-app, als een van de super-apps, de scène uitbreidt en de ruimte gebruikt op basis van het grote AI-model, waarmee het eerste schot wordt afgevuurd van “terugkerende applicaties naar mensen ” in het AI-tijdperk.

Informatiebron: samengesteld uit 8BTC door 0x Information.Copyright behoort toe aan de auteur, mag zonder toestemming niet worden gereproduceerd

Total
0
Shares
Related Posts