❓
물음표살인마 블로그
  • README
  • ALGORITHM
    • Sieve of Eratosthenes
    • Round Up
    • Binary Search
    • Union Find
    • Sorting Array
    • Lcm, Gcd
  • TechTalk Review
    • Template
  • Books
    • CS Note for Interview
      • Ch1. Design Pattern & Programming paradigm
        • 1.1.1 Singleton Pattern
        • 1.1.2 Factory Pattern
        • 1.1.4 Observer Pattern
        • 1.1.5 Proxty Pattern & Proxy Server
        • 1.1.8 Model-View-Controller Pattern
        • 1.2.1 Declarative and Functional Programming
        • 1.2.2 Object Oriented Programming
      • Ch2. Network
        • 2.2.1 TCP/IP Four-Layer Model
        • 2.2.1-1 TCP 3, 4 way handshake
        • 2.3 Network Devices L4, L7
        • 2.4.1 ARP, RARP
        • 2.4.2 Hop By Hop Communication
        • 2.4.3 IP Addressing Scheme
      • Ch3. Operating System
        • 3.1.1 Roles and Structure of Operating Systems
        • 3.2.1 Memory Hierarchy
        • 3.2.2 Memory Management
        • 3.3.1 Processes and Compilation Process
        • 3.3.3 Memory Structure of a Process
        • 3.3.4 Process Control Block (PCB)
        • 3.3.5 Multiprocessing
        • 3.3.6 Threads and Multithreading
        • 3.3.7 Shared Resources and Critical Sections
        • 3.3.8 Deadlock
        • 3.4 CPU Scheduling Algorithm
      • Ch4. Database
        • 4.1 Database Basic
        • 4.2 Normalization
        • 4.3 Transaction and Integrity
        • 4.4 Types of Databases
        • 4.5 Indexes
        • 4.6 Types of Joins
        • 4.7 Principles of Joins
      • Ch5. Data Structure
    • Learning the Basics of Large-Scale System Design through Virtual Interview Cases
      • 1. Scalability based on user counts(1/2)
      • 1. Scalability based on user counts(2/2)
      • 2.Back-of-the-envelope estimation
      • 3. Strategies for System Design Interviews
      • 4. Rate Limiter
      • 5. Consistent Hashing
      • 6. Key-Value System Design
      • 7. Designing a Unique ID Generator for Distributed Systems
      • 8. Designing a URL Shortener
      • 9. Designing a Web Crawler
      • 10. Notification System Design
      • 11. Designing a News Feed System
      • 12. Chat System Design
      • 13. AutoComplete
      • 14. Design YouTube
      • 15. Design Google Drive
      • Loadbalancer Algorithms
      • Cache tier
      • CDN, Content Delivery Network
      • Stateless Web tier
    • Computer System A programmer's perspective
    • Effective Java
      • Item 1. Consider Static Factory Methods Instead of Constructors
      • Item 2. Consider a Builder When Faced with Many Constructor Parameters
      • Item 3. Ensure Singleton with Private Constructor or Enum Type
      • Item 4. Enforce Noninstantiability with a Private Constructor
      • Item 5. Prefer Dependency Injection to Hardwiring Resources
      • Item 6. Avoid Creating Unnecessary Objects
      • Item 7. Eliminate Obsolete Object References
      • Item 8. Avoid Finalizers and Cleaners
      • Item 9.Prefer try-with-resources to try-finally
      • Item10. Adhering to General Rules When Overriding equals
        • Handling Transitivity Issues
        • Ensuring Consistency
      • Item11. Override hashCode When You Override equals
      • Item12. Always Override toString
        • Always Override toString
      • Item13. Override Clone Judiciously
      • Item14. Consider Implementing Comparable
      • Item15. Minimize the Accessibility of Classes and Members
      • Item16. Accessor Methods Over Public Fields
      • Item17. Minimize Mutability
      • Item18. Composition over inherentance
      • Item19. Design and Document for Inheritance, or Else Prohibit It
      • Item20. Prefer Interfaces to Abstract Classes
      • Item21. Design Interfaces with Implementations in Mind
      • Item22. Use Interfaces Only to define Types
      • Item23. Prefer Class Hierarchies to Tagged Classes
      • Item24. Favor Static Member Classes Over Non-Static
      • Item28. Use Lists Instead of Arrays
      • Item29. Prefer Generic Types
      • Item30. Favor Generic Methods
    • Head First Design Patterns
      • Ch1. Strategy Pattern
      • Ch2. Observer Pattern
        • Ver1. Ch2. Observer Pattern
      • Ch3. Decorator Pattern
        • Ch3. Decorator Pattern
      • Ch4. Factory Pattern
      • Ch5. Singleton Pattern
      • Ch6. Command Pattern
      • Ch7. Adapter and Facade Pattern
      • Ch8. Template Method Pattern
    • Digging Deep into JVM
      • Chapter 2. Java Memory Area & Memory Overflow
      • Chapter 3. Garbage Collector & Memory Allocation Strategy (1/2)
      • Chapter 3. Garbage Collector & Memory Allocation Strategy (2/2)
      • Chapter 5. Optimization Practice
      • Chapter 6. Class file structure
      • Chapter 8. Bytecode Executor Engine (1/2)
  • Interview Practices
    • Restful API Practices
      • Url Shortener API
      • Event Ticket Reservation API
      • Course Management API
      • Search posts by tags API
      • Online Code platform API
      • Simple Task Management API
      • Event Participation API
      • Review System API
      • Car management API
      • Online Library
    • Tech Review
      • if(kakao)
        • Kakao Account Cache Migration / if(kakao)2022
        • Improving the Anomaly Detection System for KakaoTalk Messaging Metrics / if(kakao) 2022
        • Standardizing API Case Handling Without Redeployment / if(kakaoAI)2024
        • JVM warm up / if(kakao)2022
    • Naver Computer Science
      • Process & Thread
      • TCP & UDP
      • Spring & Servlet
      • Filter & Interceptor & AOP
      • Equals() & ==
      • Dependency Injection
      • Object Oriented Programming
  • F-Lab
    • Week1
      • Client & Server
      • HTTP
      • TCP/UDP
      • REST API
      • Questions
        • Object Oriented Programming
        • HTTP
        • Process & Thread
        • Data Structure
    • Week2
      • OSI 7 layer
      • Web vs WAS
    • Week3
      • RDB vs NoSQL
      • RDB Index
      • Cache
      • Redis
      • Messaging Queue
    • Week4
      • Project - Ecommerce
    • Week5
      • ERD - 1
    • Week6
      • Ecommerce - 2
      • Role
      • pw hashing && Salt
      • CreatedAt, ModifiedAt
      • JWT
      • Copy of ERD - 1
    • Week7
      • Vault (HashiCorp Vault)
    • Week 8
      • Api Endpoints
    • Week10
      • Product Create Workflow
  • TOY Project
    • CodeMentor
      • Implementation of Kafka
      • Project Improvement (Architectural Enhancements)
      • Communication between servers in msa
  • JAVA
    • MESI protocol in CAS
    • CAS (Compare and Set)
    • BlockingQueue
    • Producer & Consumer
    • Synchronized && ReentrantLock
    • Memory Visibility
    • Checked vs Unchecked Exception
    • Thread
    • Batch delete instead of Cascade
    • Java Questions
      • Week 1(1/2) - Basic Java
      • Week 1(2/2) - OOP
      • Week 2(1/2) - String, Exception, Generic
      • Week2(2/2) Lambda, Stream, Annotation, Reflection
      • Week3(1/2) Collections
      • Week3(2/2) Threads
      • Week4 Java Concurrency Programming
      • Week5 JVM & GC
    • Java 101
      • JVM Structure
      • Java Compiles and Execution Method
      • Override, Overload
      • Interface vs Abstract Class
      • Primitive vs Object Type
      • Identity and equality
      • String, StringBuilder, StringBuffer
      • Checked Exceptions and Unchecked Exceptions
      • Java 8 methods
      • Try-with-reources
      • Strong Coupling and Loose Coupling
      • Serialization and Deserialization
      • Concurrency Programming in Java
      • Mutable vs Immutable
      • JDK vs JRE
  • SPRING
    • DIP. Dependency Inversion Principal
    • Ioc container, di practice
    • @Transactional
    • Proxy Pattern
    • Strategy Pattern
    • Template Method Pattern
    • using profile name as variable
    • Spring Questions
      • Spring Framework
      • Spring MVC & Web Request
      • AOP (Aspect-Oriented Programming)
      • Spring Boot
      • ORM & Data Access
      • Security
      • ETC
  • DATABASE
    • Enhancing Query Performance & Stability - User list
    • Ensuring Data Consistency, Atomicity and UX Optimization (feat.Firebase)
    • Redis: Remote Dictionary Server
    • Database Questions
      • Week1 DBMS, RDBMS basics
      • Week2 SQL
      • Week3 Index
      • Week4 Anomaly, Functional Dependency, Normalization
      • Week5 DB Transaction, Recovery
    • Normalization
      • 1st Normal Form
      • 2nd Normal Form
      • 3rd Normal Form
  • NETWORK
    • HTTP & TCP head of line blocking
    • HTTP 0.9-3.0
    • Blocking, NonBlocking and Sync, Async
    • Network Questions
      • Week1 Computer Network Basic
      • Week2(1/3) Application Layer Protocol - HTTP
      • Week2(2/3) Application Layer Protocol - HTTPS
      • Week2(3/3) Application Layer Protocol - DNS
      • Week3 Application Layer
      • Week4 Transport Layer - UDP, TCP
      • Week5 Network Layer - IP Protocol
    • Network 101
      • https://www.google.com
      • TCP vs UDP
      • Http vs Https
      • TLS Handshake 1.2
      • HTTP Method
      • CORS & SOP
      • Web Server Software
  • OS
    • Operating System Questions
      • Week1 OS & How Computer Systems Work
      • Week2(1/2) Process
      • Week2(2/2) Thread
      • Week3 CPU Scheduling
      • Week4 Process Synchronize
      • Week5 Virtual Memory
    • Operating System 101
      • Operating system
        • The role of the operating system
        • The composition of the operating system.
      • Process
        • In Linux, are all processes except the initial process child processes?
        • Zombie process, orphan process
        • (Linux) Daemon process
        • Process address space
        • Where are uninitialized variables stored?
        • Determination of the size of the Stack and Heap
        • Access speed of Stack vs Heap
        • Reason for memory space partitioning
        • Process of compiling a process
        • sudo kill -9 $CURRENT_PID
      • Thread
        • Composition of a thread's address space
      • Process vs Thread
        • Creation of processes and threads in Linux
      • Multiprocessing
        • Web Browser
        • Implementation of multiprocessing
        • Application areas of multiprocessing
      • Multithreading
        • Application areas of multithreading
      • Interrupt
        • HW / SW Interrupt
        • Method of handling interrupts
        • Occurrence of two or more interrupts simultaneously
      • Polling
      • Dual Mode
        • Reason for distinguishing between user mode and kernel mode
      • System call
        • Differentiation between system calls
        • Types of system calls
        • Execution process of a system call
      • Process Control Block (PCB)
        • PCB의 구조
        • 쓰레드는 PCB를 갖고 있을까?
        • 프로세스 메모리 구조
      • Context switching
        • Timing of context switching
        • Registers saved during context switching
        • Context switching in processes
        • Context switching in threads
        • Difference between context switching in processes and threads
        • Information of the current process during context switching
      • Interprocess Communication (IPC)
        • Cases where IPC is used
        • Process address space in IPC Shared Memory technique
        • Types of IPC
  • COMPUTER SCIENCE
    • Computer Architecture 101
      • 3 components of a computer
      • RAM vs ROM
      • CPU vs GPU
      • SIMD
      • Two's complement
      • Harvard Architecture vs. von Neumann Architecture
      • The structure of a CPU.
      • Instruction cycle (CPU operation method)
      • Instruction pipelining
      • Bus
      • Memory area
      • Memory hierarchy structure
        • Reason for using memory hierarchy structure
      • Cache memory
      • L1, L2, L3 Cache
      • Locality of reference (cache)
      • Fixed-point vs Floating-point
        • epresentation of infinity and NaN (Not a Number) in floating-point
      • RISC vs CISC
      • Hamming code
      • Compiler
      • Linking
      • Compiler vs Interpreter
      • Mutex vs Semaphore
      • 32bit CPU and 64bit CPU
      • Local vs Static Variable
      • Page
  • Programming Paradigm
    • Declarative vs Imperative
  • JPA, QueryDsl
    • why fetchResults() is deprecated
  • PYTHON
    • Icecream
  • FASTAPI
    • Template Page
  • LINUX
    • Template Page
  • DATA STRUCTURE
    • Counting Sort
    • Array vs Linked List
  • GIT, Github
    • git clone, invalid path error
  • INFRA
    • Template Page
  • AWS
    • Server Log Archive Pipeline
    • Image Processing using Lambda
  • DOCKER
    • Docker and VM
    • Python Executable Environment
    • Docker commands
  • docker-compose
    • Kafka, Multi Broker
  • KUBERNATES
    • !Encountered Errors
      • my-sql restarts
      • kafka producer: disconnected
    • Kubernetes Components
    • Helm
      • Helm commands
    • Pod network
    • Service network
      • deployment.yaml
      • services.yaml
    • Service type
      • Cluster IP
      • NodePort
    • service-name-headless?
    • kube-proxy
  • GraphQL
    • Template Page
  • WEB
    • Template Page
  • Reviews
    • Graphic Intern Review
    • Kakao Brain Pathfinder Review
    • JSCODE 자바 1기 Review
  • 😁Dev Jokes
    • Image
      • Plot twist
      • Priorities
      • SQL join guide
      • Google is generous
      • Genie dislikes cloud
      • buggy bugs
      • last day of unpaid internship
      • what if clients know how to inspect
      • its just game
      • how i wrote my achievement on resume
      • self explanatory
      • chr(sum(range(ord(min(str(not))))))
Powered by GitBook
On this page
  1. Books
  2. CS Note for Interview
  3. Ch4. Database

4.5 Indexes

인덱스: 데이터베이스 성능 최적화의 핵심

인덱스는 데이터베이스 성능을 최적화하는 중요한 도구입니다. 대량의 데이터에서 특정 레코드를 빠르게 검색하거나, 데이터를 효율적으로 정렬하기 위해 인덱스가 사용됩니다. 그러나 인덱스는 잘못 설계되거나 과도하게 사용될 경우 오히려 성능 저하를 일으킬 수 있습니다. 인덱스의 필요성과 다양한 인덱스 구조 및 최적화 기법을 이해하는 것이 중요합니다.

4.5.1 인덱스의 필요성

인덱스는 데이터베이스에서 데이터를 빠르게 검색할 수 있도록 도와주는 자료 구조입니다. 데이터를 저장하는 테이블에서 특정 열(컬럼)에 대해 인덱스를 생성하면, 데이터베이스는 이 인덱스를 사용하여 검색 속도를 대폭 향상시킬 수 있습니다.

예시: 사용자 테이블에서 이메일 주소로 특정 사용자를 검색한다고 가정해 봅시다. 만약 이메일 열에 인덱스가 없다면, 데이터베이스는 전체 테이블을 순차적으로 검색하여 해당 사용자를 찾아야 합니다. 이는 데이터가 많을수록 시간이 많이 소요됩니다. 그러나 이메일 열에 인덱스를 생성하면, 데이터베이스는 인덱스를 통해 해당 사용자의 위치를 신속하게 파악하여 검색 속도가 크게 향상됩니다.

CREATE INDEX idx_email ON users(email);

위 SQL 명령어는 users 테이블의 email 열에 인덱스를 생성하여 검색 속도를 높여줍니다.

4.5.2 B-트리

**B-트리(B-Tree)**는 대부분의 관계형 데이터베이스 시스템에서 인덱스를 구현하는 데 사용되는 자료 구조입니다. B-트리는 균형 잡힌 트리 구조로, 데이터베이스는 이 구조를 통해 검색, 삽입, 삭제 작업을 효율적으로 처리할 수 있습니다. B-트리의 각 노드는 여러 개의 키와 자식을 가질 수 있으며, 트리의 깊이를 최소화하여 검색 작업의 효율성을 높입니다.

  • 특징: B-트리는 각 노드가 여러 자식을 가지며, 노드 간의 균형을 유지하는 구조로 되어 있습니다. 이는 데이터가 삽입되거나 삭제될 때도 트리가 균형 상태를 유지하도록 하여, 검색 및 삽입 작업이 항상 일정한 시간 내에 이루어지도록 보장합니다.

  • 장점: B-트리는 균형을 유지하여 모든 노드의 탐색 깊이가 동일하므로, 성능이 안정적입니다. 또한, 데이터의 삽입과 삭제가 빈번하게 일어나는 환경에서도 효과적입니다.

예시: 만약 고객 테이블에서 고객의 나이를 기준으로 인덱스를 생성했다고 가정합시다. B-트리 인덱스는 나이 값에 따라 정렬된 구조를 유지하며, 특정 나이 범위에 해당하는 고객을 빠르게 검색할 수 있게 도와줍니다.

CREATE INDEX idx_age ON customers(age);

이 인덱스는 customers 테이블의 age 열에 대해 B-트리 구조의 인덱스를 생성합니다.

4.5.4 인덱스 최적화 기법

인덱스는 성능 최적화에 매우 유용하지만, 잘못된 인덱스 설계나 관리로 인해 오히려 성능 저하를 초래할 수 있습니다. 이를 방지하기 위해 다음과 같은 인덱스 최적화 기법을 사용할 수 있습니다:

  1. 인덱스는 비용이다 인덱스를 생성하면 검색 성능은 향상되지만, 데이터 삽입, 업데이트, 삭제 시 추가적인 비용이 발생합니다. 따라서, 필요하지 않은 인덱스를 생성하지 않도록 주의해야 합니다. 예를 들어, 자주 검색되지 않는 열에 대해 인덱스를 생성하면, 이 인덱스를 유지하는 비용이 쿼리 성능 향상보다 더 클 수 있습니다.

  2. 항상 테스팅하라 인덱스의 효과는 쿼리 패턴과 데이터 분포에 따라 달라집니다. 인덱스를 추가하기 전에 쿼리 성능을 분석하고, 인덱스가 실제로 성능 향상에 기여하는지 테스트하는 것이 중요합니다. 특히, 데이터베이스의 실행 계획을 확인하여 인덱스가 사용되는지 확인해야 합니다.

    EXPLAIN SELECT * FROM users WHERE email = 'example@example.com';

    이 명령어를 사용하면 쿼리 실행 계획을 확인할 수 있으며, 인덱스가 실제로 적용되고 있는지 알 수 있습니다.

  3. 복합 인덱스는 같음, 정렬, 다중 값, 카디널리티 순이다 복합 인덱스(Composite Index)는 여러 열을 조합하여 하나의 인덱스로 만드는 것입니다. 복합 인덱스를 설계할 때는 쿼리의 WHERE 절이나 ORDER BY 절에서 가장 자주 사용되는 열을 먼저 배치해야 합니다. 특히, 필터링 조건으로 자주 사용되는 열을 선두에 두는 것이 중요합니다.

    CREATE INDEX idx_user_email_age ON users(email, age);

    이 인덱스는 email과 age 열에 대해 복합 인덱스를 생성하며, email을 기준으로 우선 검색한 후, 동일한 email을 가진 행에서 age를 기준으로 정렬합니다.

  4. 카디널리티(Cardinality) 카디널리티는 특정 열에 있는 값의 고유한 수를 나타냅니다. 카디널리티가 높은 열(즉, 고유 값이 많은 열)에 인덱스를 생성하면 검색 성능이 더 크게 향상됩니다. 반면, 카디널리티가 낮은 열(즉, 중복 값이 많은 열)은 인덱스 생성의 이점이 적을 수 있습니다.

    예를 들어, 성별(Gender)처럼 값이 '남성'과 '여성' 두 개만 있는 열은 카디널리티가 낮기 때문에, 성별에 대한 인덱스는 큰 성능 향상을 기대하기 어렵습니다.

인덱스는 데이터베이스 성능 최적화의 핵심 요소이지만, 신중한 설계와 지속적인 모니터링이 필요합니다. 불필요한 인덱스는 제거하고, 중요한 쿼리에 대해 가장 적합한 인덱스를 적용하여 최적의 성능을 유지하는 것이 중요합니다.

Previous4.4 Types of DatabasesNext4.6 Types of Joins

Last updated 9 months ago