LJSear.ch - een dienst voor degenen die de bestanden moeten "Levende Journal"
Web Services / / December 24, 2019
Wilt u vinden in de "Learn" honderd jaar oude record, maar kan niet, omdat de zoekmogelijkheden zijn beperkt tot één maand? U heeft gratis dienst LJSear.ch, Die bevat het archief van de Russischtalige LiveJournal voor de periode 2000-2015. Praat erover de maker Roman Ivanov (kukutz).
Roman Ivanov
Product Manager in de "Yandex". Is gestart met een blog search, search "Yandex", verschillende versies van "Yandex. Mail "diensten" Yandex. Lenta "" Ya.ru "" Yandex. Pictures "en verscheidene anderen. Het is nu bezig met "Yandex. Browser "en LJSear.ch.
Wat is LJSear.ch?
"Leren" Dit is meer dan een terabyte archieven. Geïndexeerd en beschikbaar om te zoeken 340 miljoen berichten en reacties 1 miljard van 2000 tot de herfst van 2015. En dit alles met de vertrouwde om te bloggen zoekfuncties: Limiet op auteur, op datum, op de gemeenschap.
Nieuwe items worden niet geïndexeerd, zoals we ons project als archief, gedenkteken overwegen.
Het project is geheel non-profit, zonder reclame, en andere manieren om geld te verdienen is niet de bedoeling.
Waarom moet ik service nodig?
In het najaar van 2015 zoekfunctie voor blogs "Yandex" werden beperkt tot slechts vorige maand. De verklaring was simpel: de overgrote meerderheid van de mensen zijn op zoek naar informatieIn verband met de recente verslagen, en diepe zoektocht naar hen is overbodig.
Het is waar. Vorige maand is genoeg voor taken zoals regelmatige controle of een make-zoekopdracht toetsingen van sommige recente gebeurtenissen. Maar er is een probleem en dieper onderzoek.
Ik geloof dat in de "Learn" gebeurd, of op zijn minst tot uiting kwam bijna alle Russisch-sprekende cultuur van de jaren nul. De waarde van dit archief kan niet worden overschat. Wanneer de "Yandex" heeft gesloten archief zoeken, ik ben zeer teleurgesteld, omdat ervan overtuigd dat deze verzameling van gegevens moeten worden bewaard voor de mensheid. Goed en ik vroeg: "Yandex" archieven, en hij plotseling overeengekomen en gaf hen.
Archief Blog vrij uniek, omdat er zoveel niet in de "Learn" kan worden gedownload. Vele tijdschriften worden verwijderd door de auteurs, een aantal gebroken en vernietigd door hackers, in sommige gevallen, records worden niet verwijderd, maar verborgen achter slot en grendel.
De afgelopen zes maanden was ik er verantwoordelijk voor dat de data niet verloren gaat. Ik riep de hulp van vrienden, en onder hen waren er mensen die overeengekomen om hulp te begrijpen of we de informatie die beschikbaar is voor de zoekopdracht kan maken. We hebben een dienst LJSear.ch gemaakt en kennelijk dreef hem naar een gezonde toestand.
De vrijwilligers waren veel?
Werden gevonden. Een gerenommeerd expert op het gebied van UX Kohl Zayarny Ik kwam met het ontwerp. Sasha Belyanskiy Ik nam de BEM-vorstku en frontend op Node.js. Spaceinvaderz bezig systemische toediening. Backend programmeren in PHP ben ik begonnen aan de hand van het prototype zelf, die mijn vriend gemaakt tobe.
Het grootste probleem was het ijzer: wie zal betalen voor de hosting? Vrienden zeker van zijn dat je kunt geld in te zamelen voor kraudfandingovyh sites, maar ik was sceptisch. En er zijn prachtige mensen kwamen om ons van Servers.ru en bood aan te helpen. Als gevolg daarvan hebben wij een grote dedicated server met SSD te indexeren en doorzoeken backend plus wolk virtuele server aan de frontend.
Die wellicht geïnteresseerd zijn in het project?
Aangezien nieuwe records niet worden geïndexeerd, het publiek, wat ik denk - zijn onderzoekers. Hoe letterlijk onderzoekers culturele lagen van de jaren nul, en een huidige of voormalige gebruikers "Leren", die willen iets dat in die jaren werd geschreven vinden. En omdat ik niet de maximale uitvoeringstermijn Zoekopdrachten heeft beperkt: onderzoeker kan wachten voor complexe queries en minuten, en twee. Natuurlijk zijn eenvoudige vragen snel uitgevoerd, en als de dienst detecteert dat de query is nu een veel, het is voorzien van een gecontroleerde afbraak, waaronder grenzen time-out verzoek.
LJSear.ch →