1s2023-unicamp-dl-for-search-systems

This repository contains my work for the "Deep Learning Aplicado à Sistemas de Busca" course at Unicamp, taken in 1s2023

The folders contain my code work for each week's project:

Week 1: Building a Simple Information Retrieval System using BM25 and GPT-3 and evaluated in the CISI collection
Week 2: Boolean, BoW and TF-IDF Search Systems
Week 3: Cross-Encoder: Text Classification and Reranking
Week 4: Zero and Few-Shot Learning
Week 5: Training a language model
Week 6: doc2query and docTTTTTquery
Week 7: Dense Passage Retrieval for Open Domain Question Answering
Week 8: SPLADE
Week 9: InPars
Week 10: Trade-offs between computation & latency

Paper slides

Week 2: Pretrained Transformers for Text Ranking: BERT and Beyond (Jimmy Lin, Rodrigo Nogueira, Andrew Yates), Chapter 1.
- Slides
Week 3: Pretrained Transformers for Text Ranking: BERT and Beyond (Jimmy Lin, Rodrigo Nogueira, Andrew Yates), Chapter 3 to 3.2.2.
- Slides
Week 4: Language Models are Few-Shot Learners (OpenAI)
- Slides
Week 5: Language Models are Unsupervised Multitask Learners (OpenAI)
- Slides
Week 6: Document Expansion by Query Prediction (Nogueira et al 2019) & From doc2query to docTTTTTquery (Nogueira & Lin 2019)
- Slides
Week 7: Dense Passage Retrieval for Open-Domain Question Answering & ColBERT: Efficient and Effective Passage Search via Contextualized Late Interaction over BERT
- Slides
Week 8: SPLADE & SPLADE v2: Sparse Lexical and Expansion Model for Information Retrieval (Formal et al 2021; Formal et al 2021) -Slides
Week 9: InPars: Data Augmentation for Information Retrieval & InPars v2: Large Language Models as Efficient Dataset Generators for Information Retrieval: Sparse Lexical and Expansion Model for Information Retrieval (Bonifacio et al 2022; Jeronymo et al 2023) -Slides
Week 10: ColBERT v2: Effective and Efficient Retrieval via Lightweight Late Interaction (Santhanam et al 2022)
- Slides

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
1-selection-project		1-selection-project
10-trade-offs		10-trade-offs
2-boolean-bow-tfidf-search-systems		2-boolean-bow-tfidf-search-systems
3-cross-encoder		3-cross-encoder
4-zero-few-shot-learning		4-zero-few-shot-learning
5-training-a-lm		5-training-a-lm
6-doc2query		6-doc2query
7-dense-passage-retriever		7-dense-passage-retriever
8-splade		8-splade
9-inpars		9-inpars
.gitignore		.gitignore
README.md		README.md