Google snakker om viktigheten av åpen kildekode og åpne data i et nylig blogginnlegg

Teknisk / Google snakker om viktigheten av åpen kildekode og åpne data i et nylig blogginnlegg 3 minutter lest

Google



Google som et selskap har alltid støttet programvare og data med åpen kildekode, i det minste i standen deres. Det er nesten en trend med store selskaper nå, ettersom både Google og Microsoft har gitt fremtredende bidrag til open source-scenen. “ Google er også en stor bidragsyter til programvare med åpen kildekode. Sentrale eksempler på dette inkluderer Android , vårt smarttelefonoperativsystem, Krom , kodebasen for Chrome-nettleseren vår (nå også som driver mange konkurrenter ), og TensorFlow , vårt maskinlæringssystem. Googles utgivelse av Guvernører endret cloud hosting for alltid, og har muliggjort innovasjon og konkurranse på tvers av skyindustrien. Google er også den største bidragsyteren til åpen kildekode GitHub , et delt lager for programvareutvikling. I 2017 utførte Googlers mer enn 250.000 endringer i titusenvis av prosjekter på GitHub alene. '

I de fleste tilfeller handler det ikke egentlig om raushet, men mer om å dra nytte av gratis utvikling og deretter tjene på bred adopsjon. Uansett har disse bidragene hjulpet tusenvis av forskere og har ledet programvareutvikling på en enhetlig måte, noe som skal feires. Google i en nylig blogginnlegg fremhevet deres bidrag til åpen data og programvare med åpen kildekode.



Med fremveksten av sporing i sanntid og utvikling av førerløse biler gjøres det mye forskning innen datasyn, og Google er et av selskapene i forkant av Visual Tech.



Vår forpliktelse til åpen kildekode og åpen data har ført til at vi deler datasett, tjenester og programvare med alle. For eksempel ga Google ut Åpne bildedatasettet på 36,5 millioner bilder som inneholder nesten 20 000 kategorier av menneskemerkede gjenstander. Med disse dataene kan datasynforskere trene bildegjenkjenningssystemer. Tilsvarende millioner av kommenterte videoer i YouTube-8M samlingen kan brukes til å trene videogjenkjenning.



- Variant ting

Sjeføkonom, Google

Google sitter også på mye data som kan hjelpe NLP-forskning og hjelpe datamaskiner bedre å forstå menneskelig tale. I blogginnlegget markerte Google delingen av en nøkkeldatabase som sier ' Med hensyn til språkbehandling har vi delt Naturlige spørsmål database, som inneholder 307.373 menneskeskapte spørsmål og svar. Vi har også gjort tilgjengelig Billioner Word Corpus , som er basert på ord som brukes på offentlige nettsider, og Ngram Viewer , som kan brukes til å utforske de mer enn 25 millioner bøkene i Google Bøker . Disse samlingene kan brukes til statistisk maskinoversettelse , talegjenkjenning, stavekorreksjon , enhetsgjenkjenning, informasjonshenting og annen språkforskning. ”



Søkemotoren er en av Googles kjernevirksomheter og får over 63 000 spørsmål hvert sekund. Disse dataene er veldig viktige for selskapet, og Google analyserer disse dataene for målrettet annonsering. Noen innsikter i de samlede dataene blir likevel offentliggjort i Googles trendportal.

' Google tilbyr også Google Trender , en gratis tjeneste som gjør det mulig for alle å se og laste ned samlet søkeaktivitet siden 2004 for Google Søk, Bildesøk, Nyhetssøk, Shopping og YouTube. Du kan få søkeinformasjon for land, regioner, metroområder og byer på en månedlig, ukentlig, daglig og til og med timebasis. Trends-dataene er mye brukt av forskere innen så varierte felt som medisin og økonomi. Ifølge Google Scholar er det mer enn 21.000 forskningsartikler som siterer Trender som datakilde. ”

Hvorfor jobbe med prosjekter med åpen kildekode?

Jeg snakket kort om dette i begynnelsen av artikkelen. En ny programvare kan implementere en god idé og innovere rommet, men det hindrer ikke andre i å implementere lignende ideer og deretter jobbe for å gjøre det bedre. Mange selskaper har lært det på den harde måten, for eksempel Windows Phone. Som vi vet var det en rungende fiasko og av mange grunner, men å ha et lukket miljø og kontrollere lisensiering var en stor del av det. Hardoop og HDFS var versjoner av MapReduce med åpen kilde bygget av Google, og selskapet lærte viktigheten av åpen kildekode tidlig. Oppsummeringen er beslutningen om å lage en IP-kildekode strategisk.

Google i blogginnlegget sitt går inn på noen få andre grunner, og sier ' Først og fremst er vårt primære oppdrag 'å organisere verdens informasjon og gjøre den allment tilgjengelig og nyttig.' Absolutt en åpenbar måte å gjøre informasjon allment tilgjengelig og nyttig på er å gi den bort ! '

De snakker også om hvorfor de ikke kan gi ut noen ting som sier ' Selvfølgelig kan vi ikke frigjøre alle dataene vi bruker i vår virksomhet. Vi må beskytte brukernes personvern, opprettholde konfidensialitet for bedriftskunder og beskytte Googles egen intellektuelle eiendom. Men med forbehold om slike hensyn, prøver vi generelt å gjøre dataene våre så “universelt tilgjengelige og nyttige” som mulig. '

Merker Google