jbaiter_ This makes it possible to leverage spacy's far superior NLP tech for document analysis in Solr. No more crappy Porter stemming! Pre-analyzed fields are a pretty neat Solr feature that has somehow flown under my radar, but they allow externalizing the complete analysis chain.
jbaiter_ ♥️spaCy. Just managed to hack together in >2h a pipeline that does tokenization, lemmatization, PoS and NER on OCR texts and then indexes that into Solr, while keeping track of the original byte offsets in the OCR so the fancy OCR highlighting in Solr still works. @explosion_ai
BuckRivera Liebes Folg, betet für mich, dass ich nicht schwach werde und das problematische Thunbergmeme poste, das ich mir ausgedacht habe.
#durchlesenvormabschicken, Tippfehler bemerken und bewusst stehenlassen ("...an Weißglut glänzende Ungeduld...")
maya_sen Good grief, journalists.
👏👏👏 Please refer to papers using the order the authors use in the paper, even if one of the authors is more senior and/or male 👏👏👏
HansvonKaese In einer WG wohnen und Urlaub machen heißt immer auch, dass die WG Urlaub von dir macht
perseveresther there are two kinds of people, each worse than the other
zehavoc @windx0303 @ArneKoehn Killian A. Foth, First of his name, King of Syntax, the Breaker of Dependency Chains, Regent of the Seven Treebanks, King of the Great Parse Trees, the Unnamed.
ojahnn strong suits are not my forte
remcoknooi Leer (Ostf) is een station in het Nederlandse ov-chipkaartgebied. Wo bleibt denn das ÖPNV-Fahrrad?
SanhEstPasMoi There is a trend for huge Transformers. We went the other way: decreasing the size! 🤗
Introducing DistilBERT: a smaller, faster, cheaper, lighter BERT trained w/ distillation!
95% of BERT's GLUE perf w/ 66M parameters.
📃: medium.com/huggingface/di…
💻: github.com/huggingface/py… pic.twitter.com/TraVr39J6v
AnneArdon Ik zit in freaking Chittagong, Bangladesh bij het zwembad van het hotel en aan de overkant een Nederlander heel hard Dunglish praten en ik HOOR gewoon dat 'ie sowieso Arjan heet.
ojahnn 🎉 Am 3. Oktober halte ich in Berlin einen Vortrag beim ersten Termin der neuen Reihe "The Word Electric"! Wer so wie ich schon die Beschreibung der Vortragenden unfassbar lustig findet, wird vermutlich auch während der Veranstaltung Spaß haben. Infos: lettretage.de/programm/aktue… pic.twitter.com/w0hoE1L1fo
labenzticker Witzwort, das: Wird dem Redner/Gastgeber erteilt, um die Veranstaltung aufzulockern. labenz.neutsch.org/Witzwort
mdlhx @ojahnn You don't want to be hired by a person who sees distractions from research as a bad thing 😄
perseveresther let me just say that while I begrudgingly obey most laws of physics, I don't condone them in any way. most are silly and archaic and in desperate need of some serious redesigning