DMOZ

Icona del globo della casella informativa
Progetto Open Directory
Logo del sito web
Gli umani lo fanno meglio
Directory web
le lingue multilingue
In linea 1998-17. marzo 2017
www.dmoz.org
Logo riccio

L' Open Directory Project ( ODP ), noto anche come dmoz (per la directory di Mozilla), è stato il più grande uomo- directory creata web sul il World Wide Web . I contenuti del progetto sono gratuiti e sono stati modificati e aggiornati da editori volontari , i cosiddetti editori.

Il 28 febbraio 2017 è stato annunciato che la directory sarebbe stata chiusa dall'operatore AOL il 17 marzo 2017 . Nulla è stato detto sui motivi.

Il progetto successivo è stato sviluppato con il nome Curlie ed è online dalla fine del 2017. Il dominio curlie.org ha un Alexa Rank di 66 806 a partire dal 2 novembre 2020.

storia

Da "Gnuhoo" al "Progetto Open Directory"

L'ODP è stato originariamente fondato con il nome di Gnuhoo ed è andato online il 5 giugno 1998. Il nome fu poi cambiato in Newhoo dopo uno Slashdot articolo indicato che Gnuhoo era non si basa su software libero e che Gnuhoo stava usando il marchio di fabbrica della GNU progetto senza autorizzazione.

Newhoo è diventato l' Open Directory Project dopo essere stato acquistato da Netscape nell'ottobre 1998 e pubblicato il suo contenuto con una licenza Open Content . Nel novembre 1998 Netscape, inclusa l'ODP, è stata acquistata da AOL , che si è fusa con Time Warner nel 2000 . La forma abbreviata "Dmoz" o "dmoz.org" deriva dal primo indirizzo di hosting directory.mozilla.org.

Il 20 ottobre 2006, l'ODP ha avuto gravi problemi tecnici. Le funzioni per suggerire collegamenti e modifiche, nonché le funzioni di modifica interne per modificare le voci di catalogo sono state bloccate. Il 18 dicembre 2006 è stato nuovamente rilasciato l'accesso per gli editori; il 13 gennaio 2007 l'interfaccia pubblica per la proposta di siti e modifiche e il 23 febbraio 2007 la possibilità di candidarsi per il nuovo editore.

motivazione

La motivazione per fondare l'ODP è stata la frustrazione per la mancanza di attualità, i. h. il lungo ritardo nell'aggiunta di nuovi siti e l'elevata percentuale di link morti nelle directory mantenute in redazione. Ma anche critiche alla commercializzazione sempre maggiore di Internet e alla sua riduzione a mezzo pubblicitario invece di dare priorità al libero accesso all'informazione.

Supponendo che gli esseri umani siano superiori ai cataloghi automatizzati e ai sistemi di ricerca, all'utente dovrebbe essere fornito un risultato di ricerca condensato qualitativamente migliore. L'espressione per questo era lo slogan Gli umani lo fanno meglio per distinguerlo dai concetti dei motori di ricerca automatizzati.

Tuttavia, anche l'ODP ha criticato la tempestività inadeguata e il lungo tempo di elaborazione. Il ritardo nella registrazione somigliava a molte categorie di coloro che in precedenza erano di Yahoo era comune. La comunità degli editori stava lottando per tenere il passo con la crescita di Internet e molti dei rami di categoria non avevano editori per gestire il gran numero di registrazioni.

imitatori

L'idea ha ispirato almeno altre due directory web , anch'esse finanziate da società private e curate da editori volontari: The Go Directory (già gestita da Disney ) e Zeal (acquistata da LookSmart ). Entrambi sono stati ora sospesi. Tuttavia, nessuna di queste directory ha pubblicato i propri dati come contenuto aperto .

struttura

L'Open Directory Project si basava su una struttura ad albero classificata nel sistema ipertestuale. Dal punto di vista dell'origine, le categorie sono state derivate tematicamente o regionalmente ed ereditate fino alle sottocategorie in 89 lingue e dialetti (al giugno 2014). Ogni voce potrebbe essere assegnata a una categoria adatta in base alla massima rilevanza per un argomento o una regione. Erano possibili anche più voci se pertinenti in più punti.

uso dei dati

Il contenuto dell'ODP era liberamente accessibile al pubblico gratuitamente. Inoltre, è stato concesso un diritto d'uso gratuito per un'ulteriore distribuzione come pubblicazione completa o parziale. I dati erano disponibili per il download in una prima forma del formato RDF . Di solito veniva rilasciata una nuova versione ogni settimana. I dati del set ODP autonomo (dump) contenevano sia le voci dell'URL che la struttura della directory, compresi i collegamenti tra le categorie.

I dati sono stati diffusi secondo le condizioni di licenza dell'Open Directory Project. Questi prevedevano una fonte ODP visibile con link per proporre nuovi inserimenti e per candidarsi a collaborare con l'ODP su ogni singola pagina che contiene il contenuto dell'ODP. A causa di questo regolamento, il contenuto è stato spesso rilevato da altri siti. Tra le altre cose, Google ha utilizzato i dati Dmoz per la propria directory web fino al 2011.

Editori

L'ODP si è descritto come un progetto di editori volontari che catalogano sistematicamente le informazioni pubblicate su Internet e le rendono disponibili al pubblico. Gli editori sono responsabili solo di determinate categorie e rami. A tal fine, sono stati affidati per consenso il maggior numero possibile di redattori diversi, ciascuno con le migliori conoscenze in un campo e un'area di interesse speciali.

Nonostante la possibilità di suggerire pagine, la directory è cresciuta principalmente attraverso le proprie ricerche da parte degli editori. Ciò includeva anche attività trasversali come la creazione di nuove sottocategorie, lo spostamento di voci in categorie più adatte e l'aggiornamento di voci e commenti.

La comunità degli editori si è formata

  • le linee guida pubblicamente disponibili
  • Fiducia nella competenza, responsabilità e affidabilità della persona
  • un principio di controllo multiplo, con coordinamento reciproco dei casi di dubbio e durante la formazione di nuovi redattori
  • Assistenza di redattori sovraordinati (metaeditori) e amministratori

sopra. Oltre al mantenimento della banca dati esistente, il lavoro degli editori comprendeva principalmente la pubblicazione di nuove voci nella categoria su cui stavano lavorando. Il lavoro nel tempo libero non era obbligatorio e non legato a orari prestabiliti.

Il processo di candidatura come nuovo editore o per nuove categorie e l'estensione dei diritti di modifica comprendeva tre collegamenti e descrizioni di esempio, nonché domande sull'argomento. La qualità e la prevenzione degli abusi giocano un ruolo prioritario, anche a causa del trasferimento dei dati in licenza aperta ad altri utenti dei dati. Non erano richiesti un minimo di istruzione precedente o referenze o simili.

Proprio come gli editori potrebbero rinunciare ai loro diritti e lasciare l'ODP, gli editori attivi potrebbero essere esclusi dal progetto con breve preavviso se le linee guida venissero violate a causa di abusi, inaffidabilità e comportamento irresponsabile.

Acquisizione e manutenzione dei dati

Le voci DMOZ comprendevano un breve titolo (di solito il nome del sito Web o dell'azienda) e una breve descrizione del contenuto, dell'offerta e delle caratteristiche speciali di un sito Web.

I criteri di inclusione sono rimasti invariati dall'avvio della directory. L'iscrizione deve essere accompagnata da un'offerta di informazioni informativa, classificabile, seria e pertinente con il proprio contenuto su un sito web. Il contenuto informativo di un sito web è stato determinato dal grado del proprio contenuto in relazione alla pubblicità (banner, Adwords, Adlinks), alle pagine integrate esternamente e alle informazioni copiate da altre pagine. I siti web che esaltano la violenza, sono razzisti, pornografici o incoraggiano atti criminali non sono stati inclusi o rimossi dal database.

Inoltre, c'erano una serie di meccanismi e strumenti progettati per migliorare la qualità dei dati e la pertinenza delle categorie, nonché per escludere l'uso improprio. A tal fine, in ogni categoria era disponibile un modulo per i suggerimenti di inclusione esterna, uno per l'aggiornamento delle richieste per le voci esistenti e uno per la verifica dei sospetti abusi (da parte dei metaeditori).

Oltre al lavoro degli editori, il crawler web dell'azienda, chiamato Robozilla, è stato inviato a intervalli regolari su tutte le voci della directory per trovare collegamenti non funzionanti, compromessi o sospetti. Robozilla li ha temporaneamente rimossi dalla directory e li ha contrassegnati per la revisione da parte degli editori che possono intraprendere ulteriori azioni.

Le voci provenienti da domini scaduti sono state in gran parte rimosse automaticamente dalla directory per garantire che fossero aggiornate e per prevenire contenuti falsi o fuorvianti attraverso il dirottamento e il "parcheggio" degli indirizzi Internet.

Nel tempo, il numero di dipendenti a tempo indeterminato assegnati al progetto da Netscape e AOL è diminuito. Ciò è stato compensato da una serie di strumenti creati dagli editori e introdotti in consultazione con l'amministrazione. Per semplificare il lavoro, sono stati creati correttori di link, web crawler specializzati , correttori ortografici, motori di ricerca migliorati e una serie di bookmarklet per gli editori.

Esternalizzazione

Nel corso degli anni, gli editori hanno avviato autonomamente una serie di progetti correlati, alcuni dei quali basati sul software utilizzato anche dall'ODP. Tuttavia, nessuno di questi ha avuto finora lo stesso successo dell'ODP stesso.

Uno di questi progetti è stato integrato direttamente nell'ODP come una directory nella directory: La filiale per bambini e giovani, kidmoz . Lì, siti selezionati specificamente per il gruppo target di bambini e giovani sono stati forniti con descrizioni appropriate e informazioni sull'età e sono stati elencati. Dal punto di vista organizzativo, questa parte della directory era relativamente indipendente, anche se le linee guida si applicavano a entrambe le directory e in entrambe erano attivi un certo numero di editori. È stata fondata nel novembre 2000.

Un altro progetto specializzato nella raccolta di tutti i dati relativi alla musica e ai musicisti è MusicMoz . Attualmente esiste solo in inglese, ma è in preparazione una filiale in lingua tedesca.

fatti e cifre

Numero di iscrizioni nella parte di lingua tedesca dell'ODP

Al 31 gennaio 2014, l'ODP ha registrato oltre 4,2 milioni di voci (quasi 500.000 nella parte di lingua tedesca del catalogo) suddivise in oltre 1.000.000 di categorie. A gennaio 2016 c'erano poco meno di 4 milioni di voci, il numero totale di redattori era di oltre 90.000. A luglio 2016 c'erano 3.938.044 voci da un totale di 91.441 redattori.

La base per l'inclusione e il mantenimento delle voci sono state le linee guida e le istruzioni accessibili al pubblico e se una pagina di informazioni per l'argomento è utile e un'aggiunta preziosa.

A settembre 2019, Curlie.org ha registrato 3.444.397 pagine (di cui 426.509 nella parte in lingua tedesca del catalogo) in 91 lingue e 1.033.965 categorie su un totale di 92.019 redattori.

link internet

Progetti di follow-up

Evidenze individuali

  1. www.dmoz.org ( Memento del 14 novembre 2017 in Internet Archive )
  2. dmoz.org ( Memento dell'11 ottobre 2016 in Internet Archive )
  3. dmoz.de. Estratto il 17 ottobre 2018 .
  4. Dmoz sarà chiuso - WebABC.info . In: WebABC.info . 2 marzo 2017 ( webabc.info [consultato il 23 marzo 2017]).
  5. ^ RIP DMOZ: Il progetto Open Directory si sta chiudendo . In: Motore di ricerca Land . 28 febbraio 2017 ( searchengineland.com [accesso 1 marzo 2017]).
  6. Il progetto di follow-up Curlie è online. Estratto il 9 dicembre 2017 .
  7. Classifica di Alexa da curlie.org, novembre 2020
  8. Slashdot: The GnuHoo BooBoo ( Memento del 28 febbraio 2014 in Internet Archive )
  9. ^ Statuto Association ( Memento del 21 ottobre 2016 in Internet Archive ) di Netscape con impegni volontari per la comunità web
  10. Licenza Open Directory ( Memento del 20 ottobre 2016 in Internet Archive )
  11. Herbert Braun: Google chiude i suoi laboratori. In: Heise Developer. 21 luglio 2011, consultato il 30 luglio 2011 : “Allo stesso tempo, Google ha tacitamente chiuso il suo catalogo web di Google Directory. Questo servizio, lanciato undici anni fa come concorrente del catalogo Yahoo, ha aggiornato i dati dalla directory dmoz di Netscape con una classifica all'interno delle categorie.
  12. Domande e risposte sulla candidatura per diventare editore all'Open Directory Project ( Memento del 18 ottobre 2016 in Internet Archive )
  13. a b Open Directory: Editing Guidelines ( Memento del 18 ottobre 2016 in Internet Archive )
  14. ^ Newsletter marzo 2001 ( Memento del 1 marzo 2017 in Internet Archive ) con presentazione del nuovo progetto
  15. curlie.org