- Apresentação do Minicurso
- O que vamos estudar?
- Visão baixa: Interconexão, Transistores, Estruturas e Limitações de Circuitos
- Visão alta: Componentes (GPU, MOBO, CPU, etc) e como se relacionam
- Como vamos estudar?
- Prática: contato com o hardware em questão
- Teoria: estudo do hardware a partir de suas especificações e arquitetura
- Quais as limitações?
- Tempo
- Quero saber mais...
- Leia os links adicionais providos neste arquivo
- O que vamos estudar?
- Módulo 1: Como computadores se comunicam
- Nível alto e Baixo
- Pacotes de Dados
- Tipos de Comunicação:
- Interna
- Barramento
- Ponto a Ponto
- UCIe
- Externa
- USB
- Ethernet
- HDMI / VGA / Display Port / DVI
- P2
- Interna
- Módulo 2: Como computadores armazenam dados
- Armazenamento em disco e capacitor
- Módulo 3: Como computadores processam
- Portas lógicas
- Ordenação dos circuitos dentro dos processadores
- Linguagens de descrição de hardware (HDL)
- Módulo 4: Tipos de computadores e processadores
- Classes de computadores
- Dispositivos Móveis, Desktop, Server, Cluster, Internet das Coisas/Embarcados
- CPU, TPU, GPGPU, ASIC, FPGA, Controlador, SoC
- Limitações:
- Transistors no longer getting much better because of the slowing of Moore’s Law and the end of Dinnard scaling,
- the unchanging power budgets for microprocessors,
- the replacement of the single power-hungry processor with several energyefficient processors, and
- the limits to multiprocessing to achieve Amdahl’s Law
- Mudanças:
- Adoção de cores de função específica
- Termos:
- Yield - quantidade de processadores que não apresentam defeitos no processo de fabricação
- Benchmarks
- Classes de computadores
- Módulo 5: Placa Mãe (MOBO)
- Partes da Placa Mãe (o que é responsável pelo que)
- Techcore
- Computer Hope
- TechGujarati
- Componentes/Informações:
- Modelo
- Informações que se obtem a partir dele são muito importantes (versão, arquitetura, família)
- Socket da CPU
- Slots de Memória
- Sata e NVME
- Conectores PCI e PCI Express
- Conectores de Fans
- Conector de Energia ATX (24 Pinos)
- CMOS
- I/O
- North Bridge
- South Bridge
- Chipset
- Outras portas (ATA, USB, etc)
- Modelo
- Overclocking (VRMs)
- PCI e Barramento
- Velocidade do barramento (GT/s)
- Partes da Placa Mãe (o que é responsável pelo que)
- Módulo 6: Processador (CPU)
- Como os chips estão organizados dentro do computador
- Packaging
- Cache
- Hierarquia de Caches
- Disposição das Caches no processador
- ALU +
- Núcleo VS Thread
- Manufacturers
- AMD, Intel, Apple, Arm, HiSilicon, Hitachi, MediaTek, Nvidia, Zhaxin, Loongson, Texas Instruments, SiFive, Samsung, Qualcomm, Fujitsu, Broadcom, Baikal
- Desafios atuais de hardware (30 min)
- Fim da Lei de Moore
- HDs não crescem em capacidade
- Temperatura de componentes e consumo de energia
- TDP (Thermal Design Power)
- Módulo 7: Placa de Vídeo (GPU)
- Lógica:
- Unidades de processamento com propósito especifico
- GPU integrada ou dedicada
- Estrutura:
- AskThatBlog
- PaperSpace
- TechSpot
- Utmel
- FreeContent
- Processadores de GPU
- VRAM (GDDR)
- VRM
- Interconnect
- I/O
- Pino de Alimentação
- Meltdown (12VHPWR)
- Electronics
- gpumag
- pactech
- sense pin
- Componentes de baixo nível
- FP32 units
- FP64 and/or SPU (Specialized Procesing Unit)
- INT32 units
- Registers
- on-chip memory:
- L0$ (rarely in consumer class hardware),
- L1$ used with Shared Memory per compute unit
- L2$ per GPU
- off-chip memory (device memory)
- instruction scheduler
- instruction dispatcher
- TMUs, ROPs - fixed pipeline units
- vksegfault
- Desafios
- Baixa taxa de transferência entre a CPU e a GPU (low bus bandwidth)
- Nomenclaturas (cada empresa usa as suas)
- Compute Units (CU/AMD e Intel) ou Streaming Multiprocessors (SMs/Nvidia)
- Fabricantes:
- Amd, Nvidia, Intel, Moore Threads, Qualcomm
- Tendências:
- Aumento na demanda de Energia
- Lógica:
- Módulo 8: Memória (RAM)
- RAM = "Random Access Memory"
- Controladora
- Chips e sua estrutura interna (CAS, RAS)
- In-Memory Computing
- Memória ECC (Error Correcting Code)
- Parâmetros de performance
- CAS
- RAS
- Largura de Banda
- JEDEC
- XMP (Overclocking predefinido da Intel)
- Técnicas para melhoria da performance
- Out of order execution
- Cache
- Prefetching
- Faz predição à partir de padrões de requisições
- Também é possível fazer prefetching por software, mas somente em alguns casos
- Módulo 9: Discos Rídigos e Sólidos (HDDs e SSDs)
- Controladora de disco
- Estrutura de Leitura
- Os discos em Si
- Baixos ganhos de performance
- HAMR