❓
물음표살인마 블로그
  • README
  • ALGORITHM
    • Sieve of Eratosthenes
    • Round Up
    • Binary Search
    • Union Find
    • Sorting Array
    • Lcm, Gcd
  • TechTalk Review
    • Template
  • Books
    • CS Note for Interview
      • Ch1. Design Pattern & Programming paradigm
        • 1.1.1 Singleton Pattern
        • 1.1.2 Factory Pattern
        • 1.1.4 Observer Pattern
        • 1.1.5 Proxty Pattern & Proxy Server
        • 1.1.8 Model-View-Controller Pattern
        • 1.2.1 Declarative and Functional Programming
        • 1.2.2 Object Oriented Programming
      • Ch2. Network
        • 2.2.1 TCP/IP Four-Layer Model
        • 2.2.1-1 TCP 3, 4 way handshake
        • 2.3 Network Devices L4, L7
        • 2.4.1 ARP, RARP
        • 2.4.2 Hop By Hop Communication
        • 2.4.3 IP Addressing Scheme
      • Ch3. Operating System
        • 3.1.1 Roles and Structure of Operating Systems
        • 3.2.1 Memory Hierarchy
        • 3.2.2 Memory Management
        • 3.3.1 Processes and Compilation Process
        • 3.3.3 Memory Structure of a Process
        • 3.3.4 Process Control Block (PCB)
        • 3.3.5 Multiprocessing
        • 3.3.6 Threads and Multithreading
        • 3.3.7 Shared Resources and Critical Sections
        • 3.3.8 Deadlock
        • 3.4 CPU Scheduling Algorithm
      • Ch4. Database
        • 4.1 Database Basic
        • 4.2 Normalization
        • 4.3 Transaction and Integrity
        • 4.4 Types of Databases
        • 4.5 Indexes
        • 4.6 Types of Joins
        • 4.7 Principles of Joins
      • Ch5. Data Structure
    • Learning the Basics of Large-Scale System Design through Virtual Interview Cases
      • 1. Scalability based on user counts(1/2)
      • 1. Scalability based on user counts(2/2)
      • 2.Back-of-the-envelope estimation
      • 3. Strategies for System Design Interviews
      • 4. Rate Limiter
      • 5. Consistent Hashing
      • 6. Key-Value System Design
      • 7. Designing a Unique ID Generator for Distributed Systems
      • 8. Designing a URL Shortener
      • 9. Designing a Web Crawler
      • 10. Notification System Design
      • 11. Designing a News Feed System
      • 12. Chat System Design
      • 13. AutoComplete
      • 14. Design YouTube
      • 15. Design Google Drive
      • Loadbalancer Algorithms
      • Cache tier
      • CDN, Content Delivery Network
      • Stateless Web tier
    • Computer System A programmer's perspective
    • Effective Java
      • Item 1. Consider Static Factory Methods Instead of Constructors
      • Item 2. Consider a Builder When Faced with Many Constructor Parameters
      • Item 3. Ensure Singleton with Private Constructor or Enum Type
      • Item 4. Enforce Noninstantiability with a Private Constructor
      • Item 5. Prefer Dependency Injection to Hardwiring Resources
      • Item 6. Avoid Creating Unnecessary Objects
      • Item 7. Eliminate Obsolete Object References
      • Item 8. Avoid Finalizers and Cleaners
      • Item 9.Prefer try-with-resources to try-finally
      • Item10. Adhering to General Rules When Overriding equals
        • Handling Transitivity Issues
        • Ensuring Consistency
      • Item11. Override hashCode When You Override equals
      • Item12. Always Override toString
        • Always Override toString
      • Item13. Override Clone Judiciously
      • Item14. Consider Implementing Comparable
      • Item15. Minimize the Accessibility of Classes and Members
      • Item16. Accessor Methods Over Public Fields
      • Item17. Minimize Mutability
      • Item18. Composition over inherentance
      • Item19. Design and Document for Inheritance, or Else Prohibit It
      • Item20. Prefer Interfaces to Abstract Classes
      • Item21. Design Interfaces with Implementations in Mind
      • Item22. Use Interfaces Only to define Types
      • Item23. Prefer Class Hierarchies to Tagged Classes
      • Item24. Favor Static Member Classes Over Non-Static
      • Item28. Use Lists Instead of Arrays
      • Item29. Prefer Generic Types
      • Item30. Favor Generic Methods
    • Head First Design Patterns
      • Ch1. Strategy Pattern
      • Ch2. Observer Pattern
        • Ver1. Ch2. Observer Pattern
      • Ch3. Decorator Pattern
        • Ch3. Decorator Pattern
      • Ch4. Factory Pattern
      • Ch5. Singleton Pattern
      • Ch6. Command Pattern
      • Ch7. Adapter and Facade Pattern
      • Ch8. Template Method Pattern
    • Digging Deep into JVM
      • Chapter 2. Java Memory Area & Memory Overflow
      • Chapter 3. Garbage Collector & Memory Allocation Strategy (1/2)
      • Chapter 3. Garbage Collector & Memory Allocation Strategy (2/2)
      • Chapter 5. Optimization Practice
      • Chapter 6. Class file structure
      • Chapter 8. Bytecode Executor Engine (1/2)
  • Interview Practices
    • Restful API Practices
      • Url Shortener API
      • Event Ticket Reservation API
      • Course Management API
      • Search posts by tags API
      • Online Code platform API
      • Simple Task Management API
      • Event Participation API
      • Review System API
      • Car management API
      • Online Library
    • Tech Review
      • if(kakao)
        • Kakao Account Cache Migration / if(kakao)2022
        • Improving the Anomaly Detection System for KakaoTalk Messaging Metrics / if(kakao) 2022
        • Standardizing API Case Handling Without Redeployment / if(kakaoAI)2024
        • JVM warm up / if(kakao)2022
    • Naver Computer Science
      • Process & Thread
      • TCP & UDP
      • Spring & Servlet
      • Filter & Interceptor & AOP
      • Equals() & ==
      • Dependency Injection
      • Object Oriented Programming
  • F-Lab
    • Week1
      • Client & Server
      • HTTP
      • TCP/UDP
      • REST API
      • Questions
        • Object Oriented Programming
        • HTTP
        • Process & Thread
        • Data Structure
    • Week2
      • OSI 7 layer
      • Web vs WAS
    • Week3
      • RDB vs NoSQL
      • RDB Index
      • Cache
      • Redis
      • Messaging Queue
    • Week4
      • Project - Ecommerce
    • Week5
      • ERD - 1
    • Week6
      • Ecommerce - 2
      • Role
      • pw hashing && Salt
      • CreatedAt, ModifiedAt
      • JWT
      • Copy of ERD - 1
    • Week7
      • Vault (HashiCorp Vault)
    • Week 8
      • Api Endpoints
    • Week10
      • Product Create Workflow
  • TOY Project
    • CodeMentor
      • Implementation of Kafka
      • Project Improvement (Architectural Enhancements)
      • Communication between servers in msa
  • JAVA
    • MESI protocol in CAS
    • CAS (Compare and Set)
    • BlockingQueue
    • Producer & Consumer
    • Synchronized && ReentrantLock
    • Memory Visibility
    • Checked vs Unchecked Exception
    • Thread
    • Batch delete instead of Cascade
    • Java Questions
      • Week 1(1/2) - Basic Java
      • Week 1(2/2) - OOP
      • Week 2(1/2) - String, Exception, Generic
      • Week2(2/2) Lambda, Stream, Annotation, Reflection
      • Week3(1/2) Collections
      • Week3(2/2) Threads
      • Week4 Java Concurrency Programming
      • Week5 JVM & GC
    • Java 101
      • JVM Structure
      • Java Compiles and Execution Method
      • Override, Overload
      • Interface vs Abstract Class
      • Primitive vs Object Type
      • Identity and equality
      • String, StringBuilder, StringBuffer
      • Checked Exceptions and Unchecked Exceptions
      • Java 8 methods
      • Try-with-reources
      • Strong Coupling and Loose Coupling
      • Serialization and Deserialization
      • Concurrency Programming in Java
      • Mutable vs Immutable
      • JDK vs JRE
  • SPRING
    • DIP. Dependency Inversion Principal
    • Ioc container, di practice
    • @Transactional
    • Proxy Pattern
    • Strategy Pattern
    • Template Method Pattern
    • using profile name as variable
    • Spring Questions
      • Spring Framework
      • Spring MVC & Web Request
      • AOP (Aspect-Oriented Programming)
      • Spring Boot
      • ORM & Data Access
      • Security
      • ETC
  • DATABASE
    • Enhancing Query Performance & Stability - User list
    • Ensuring Data Consistency, Atomicity and UX Optimization (feat.Firebase)
    • Redis: Remote Dictionary Server
    • Database Questions
      • Week1 DBMS, RDBMS basics
      • Week2 SQL
      • Week3 Index
      • Week4 Anomaly, Functional Dependency, Normalization
      • Week5 DB Transaction, Recovery
    • Normalization
      • 1st Normal Form
      • 2nd Normal Form
      • 3rd Normal Form
  • NETWORK
    • HTTP & TCP head of line blocking
    • HTTP 0.9-3.0
    • Blocking, NonBlocking and Sync, Async
    • Network Questions
      • Week1 Computer Network Basic
      • Week2(1/3) Application Layer Protocol - HTTP
      • Week2(2/3) Application Layer Protocol - HTTPS
      • Week2(3/3) Application Layer Protocol - DNS
      • Week3 Application Layer
      • Week4 Transport Layer - UDP, TCP
      • Week5 Network Layer - IP Protocol
    • Network 101
      • https://www.google.com
      • TCP vs UDP
      • Http vs Https
      • TLS Handshake 1.2
      • HTTP Method
      • CORS & SOP
      • Web Server Software
  • OS
    • Operating System Questions
      • Week1 OS & How Computer Systems Work
      • Week2(1/2) Process
      • Week2(2/2) Thread
      • Week3 CPU Scheduling
      • Week4 Process Synchronize
      • Week5 Virtual Memory
    • Operating System 101
      • Operating system
        • The role of the operating system
        • The composition of the operating system.
      • Process
        • In Linux, are all processes except the initial process child processes?
        • Zombie process, orphan process
        • (Linux) Daemon process
        • Process address space
        • Where are uninitialized variables stored?
        • Determination of the size of the Stack and Heap
        • Access speed of Stack vs Heap
        • Reason for memory space partitioning
        • Process of compiling a process
        • sudo kill -9 $CURRENT_PID
      • Thread
        • Composition of a thread's address space
      • Process vs Thread
        • Creation of processes and threads in Linux
      • Multiprocessing
        • Web Browser
        • Implementation of multiprocessing
        • Application areas of multiprocessing
      • Multithreading
        • Application areas of multithreading
      • Interrupt
        • HW / SW Interrupt
        • Method of handling interrupts
        • Occurrence of two or more interrupts simultaneously
      • Polling
      • Dual Mode
        • Reason for distinguishing between user mode and kernel mode
      • System call
        • Differentiation between system calls
        • Types of system calls
        • Execution process of a system call
      • Process Control Block (PCB)
        • PCB의 구조
        • 쓰레드는 PCB를 갖고 있을까?
        • 프로세스 메모리 구조
      • Context switching
        • Timing of context switching
        • Registers saved during context switching
        • Context switching in processes
        • Context switching in threads
        • Difference between context switching in processes and threads
        • Information of the current process during context switching
      • Interprocess Communication (IPC)
        • Cases where IPC is used
        • Process address space in IPC Shared Memory technique
        • Types of IPC
  • COMPUTER SCIENCE
    • Computer Architecture 101
      • 3 components of a computer
      • RAM vs ROM
      • CPU vs GPU
      • SIMD
      • Two's complement
      • Harvard Architecture vs. von Neumann Architecture
      • The structure of a CPU.
      • Instruction cycle (CPU operation method)
      • Instruction pipelining
      • Bus
      • Memory area
      • Memory hierarchy structure
        • Reason for using memory hierarchy structure
      • Cache memory
      • L1, L2, L3 Cache
      • Locality of reference (cache)
      • Fixed-point vs Floating-point
        • epresentation of infinity and NaN (Not a Number) in floating-point
      • RISC vs CISC
      • Hamming code
      • Compiler
      • Linking
      • Compiler vs Interpreter
      • Mutex vs Semaphore
      • 32bit CPU and 64bit CPU
      • Local vs Static Variable
      • Page
  • Programming Paradigm
    • Declarative vs Imperative
  • JPA, QueryDsl
    • why fetchResults() is deprecated
  • PYTHON
    • Icecream
  • FASTAPI
    • Template Page
  • LINUX
    • Template Page
  • DATA STRUCTURE
    • Counting Sort
    • Array vs Linked List
  • GIT, Github
    • git clone, invalid path error
  • INFRA
    • Template Page
  • AWS
    • Server Log Archive Pipeline
    • Image Processing using Lambda
  • DOCKER
    • Docker and VM
    • Python Executable Environment
    • Docker commands
  • docker-compose
    • Kafka, Multi Broker
  • KUBERNATES
    • !Encountered Errors
      • my-sql restarts
      • kafka producer: disconnected
    • Kubernetes Components
    • Helm
      • Helm commands
    • Pod network
    • Service network
      • deployment.yaml
      • services.yaml
    • Service type
      • Cluster IP
      • NodePort
    • service-name-headless?
    • kube-proxy
  • GraphQL
    • Template Page
  • WEB
    • Template Page
  • Reviews
    • Graphic Intern Review
    • Kakao Brain Pathfinder Review
    • JSCODE 자바 1기 Review
  • 😁Dev Jokes
    • Image
      • Plot twist
      • Priorities
      • SQL join guide
      • Google is generous
      • Genie dislikes cloud
      • buggy bugs
      • last day of unpaid internship
      • what if clients know how to inspect
      • its just game
      • how i wrote my achievement on resume
      • self explanatory
      • chr(sum(range(ord(min(str(not))))))
Powered by GitBook
On this page
  • 1. AWS Lambda 소개
  • 2. 이미지 처리의 기본
  • 3. 이미지 파일 업로드 프로세스
  • [클라이언트 -> 람다] 이미지 업로드 과정
  • [클라이언트 -> API] 이미지 업로드 과정
  • [배치 -> API] 파일 정리
  • 4. 문제 인식: 이미지 확대 시의 메모리 최적화
  • 메모리 관리의 기본
  • 이미지 리사이징 및 크롭 처리
  • CloudWatch를 통한 메모리 모니터링
  • 5. 문제 인식:
  • 5.1. 기존불필요한 For Loop 처리 : Lambda의 실행 모델 변경
  • 5.2. 코드의 복잡성을 줄이고, 함수의 실행 효율성 개선
  • 5.3. If문과 max메서드의 중복 문제 및 해결
  • 5.4. 메서드 체이닝을 통한 메모리 관리
  1. AWS

Image Processing using Lambda

AWS Lambda를 이용한 이미지 처리 최적화 전략

PreviousServer Log Archive PipelineNextDocker and VM

Last updated 6 months ago

1. AWS Lambda 소개

AWS Lambda는 서버리스 아키텍처를 실현하는 AWS의 서비스로, 개발자가 서버를 직접 관리하지 않고도 코드를 실행할 수 있는 환경을 제공합니다. 이 서비스의 주요 장점 중 하나는 자동 확장성입니다. 요청이 증가함에 따라 Lambda 함수는 자동으로 리소스를 조정하여 처리 능력을 높입니다. 반면, 사용량이 감소하면 리소스를 축소하여 비용을 절약할 수 있습니다.

2. 이미지 처리의 기본

이미지 처리에는 리사이징, 포맷 변경, 메타데이터 추출 등 다양한 조작을 포함합니다. 주로 이미지 품질을 개선하거나, 특정 정보를 추출하기 위해 사용됩니다. 클라우드 기반 이미지 처리는 대규모 이미지 라이브러리의 관리를 용이하게 하고, 애플리케이션의 응답성과 성능을 향상시킵니다. 서버리스 아키텍처(AWS Lambda)를 이용한 이미지 처리 구현은 자원 사용을 최적화하고, 비용을 절감할 수 있는 큰 이점을 제공합니다.

3. 이미지 파일 업로드 프로세스

클라이언트에서 이미지를 업로드하면 아래와 같은 과정을 거칩니다.

[클라이언트 -> 람다] 이미지 업로드 과정

[클라이언트 -> API] 이미지 업로드 과정

[배치 -> API] 파일 정리

4. 문제 인식: 이미지 확대 시의 메모리 최적화

메모리 관리의 기본

메모리 관리는 효율적인 소프트웨어 개발의 핵심 요소입니다. (특히 이미지 처리와 같은 리소스 집약적 작업에서 매우 중요합니다.) 효과적인 메모리 관리를 통해 애플리케이션의 성능을 최적화하고 시스템 안정성을 유지할 수 있습니다. 고해상도 이미지 처리를 수행할 때, 이미지 데이터는 상당한 양의 메모리를 소비할 수 있으며, 이로 인해 메모리 오버플로우나 애플리케이션의 응답 속도 저하와 같은 문제가 발생할 수 있습니다.

따라서, 메모리 할당과 해제를 적절히 관리하고, 불필요한 메모리 사용을 최소화하는 전략이 필수적입니다. 이를 위해ㅐ, 개발자는 메모리 사용 패턴을 장기적으로 모니터링하고, 프로파일링 도구를 활용하여 메모리 누수를 탐지해ㅐ야합니다. 추가로, 가능하면 변수의 스코프를 최소화하고, 대용량 처리 시 스트리밍 또는 청킄 단위 처리를 고려하여 메모리 사용량을 관리하는 것이 좋습니다.

현재 프로젝트에서 고려하는 부분들은 다음과 같습니다.

  • 이미지를 극한으로 확대했을 때, 프로세싱에 문제가 없는가?

  • 이미지를 극한으로 축소했을 때, 프로세싱에 문제가 없는가?

  • 8k 이상의 초고해상도 이미지를 업로드 했을 때, 프로세싱에 문제가 없는가?

  • 이미지를 움직였을때, 알맞은 위치로 업로드 되는가?(좌측 상단, 우측 하단 등)

마지막을 제외하고는 모두 메모리의 문제가 가장 컸습니다.

이미지 리사이징 및 크롭 처리

이미지 리사이징과 크롭은 일반적으로 웹 애플리케이션에서 사용자가 업로드한 이미지를 적절한 크기와 비율로 조정하기 위해 수행되는 작업입니다. 이러한 작업은 서버의 리소스를 상당히 소모할 수 있으며, 특히 대량의 이미지를 처리할 경우 메모리 사용 최적화가 중요해집니다. sharp 라이브러리는 Node.js 환경에서 효율적인 이미지 변환을 위한 도구로, 네이티브 바인딩을 통해 이미지 처리 성능을 대폭 향상시킵니다.

저는 sharp를 사용하여 이미지 리사이징과 크롭을 수행할 때, 체인 방식으로 메서드를 연결함으로써 중간 단계의 버퍼 생성을 최소화하고 메모리 사용량을 줄일 수 있었습니다. 이는 또한 코드의 가독성과 유지보수성을 향상시키는 이점을 제공합니다. 이미지 처리 시, 리사이징과 크롭 작업 전에 이미지의 초기 해상도와 목표 해상도를 고려하여 필요한 최소한의 데이터만 처리하도록 계획하여 메모리 사용량을 최적화 하였습니다.

CloudWatch를 통한 메모리 모니터링

AWS CloudWatch는 AWS 리소스 및 애플리케이션을 실시간으로 모니터링하는 서비스로, 메모리 사용량, CPU 사용량, 네트워크 트래픽 등 다양한 지표를 제공합니다. 특히 AWS Lambda와 같은 서버리스 아키텍처에서 CloudWatch를 사용하여 메모리 사용량을 모니터링하면, 함수 실행 시 발생할 수 있는 메모리 관련 문제를 신속하게 식별하고 대응할 수 있습니다. CloudWatch 알람을 설정하여 메모리 사용량이 임계값을 초과할 경우 알림을 받을 수 있으며, 이를 통해 메모리 사용량이 높아질 때 적절한 조치를 취할 수 있습니다. 또한, CloudWatch 로그를 분석하여 메모리 사용 패턴을 이해하고, 애플리케이션의 성능을 최적화하기 위한 인사이트를 얻을 수 있습니다. CloudWatch를 활용한 메모리 모니터링은 AWS Lambda 함수의 안정성과 효율성을 보장하는 데 중요한 역할을 합니다.

5. 문제 인식:

5.1. 기존불필요한 For Loop 처리 : Lambda의 실행 모델 변경

개발 초기 단계에서는 Lambda 함수가 여러 이미지 파일을 한번에 처리할 수 있도록 설계되었습니다. 하지만 실행 모델이 변경되면서, 각 이미지마다 개별적으로 Lambda 함수가 트리거되는 방식으로 전환이 되었고, 기존의 코드는 레거시 코드가 되었습니다.

5.2. 코드의 복잡성을 줄이고, 함수의 실행 효율성 개선

getFiles 함수는 여러 파일 정보를 처리하기 위해 설계되었으나, 실행 모델의 변경으로 인해 더 이상 적합하지 않게 되었습니다. 그래서, 'getFile 함수로 변경하여 단일 파일만 처리하는 구조로 개선하였습니다.

5.3. If문과 max메서드의 중복 문제 및 해결

코드 리팩토링 과정에서 발견된 if문과 Math.max 메서드의 중복 사용 문제를 해결했습니다. 기존에는 조건문을 통해 변수의 값을 검증하고 조정하는 방식을 사용했었지만, 리팩토링을 통하여 보다 효율적이고 간결한 코드로 개선했습니다.

5.4. 메서드 체이닝을 통한 메모리 관리

메서드 체이닝을 통해 메모리 관리를 효율적으로 개선하였습니다. 기존 코드에서는 중간 단계 결과를 각 변수에 저장하는 방식으로 처리가 됐었습니다. 변수에 저장을 하게 되면 쓸데없는 메모리를 점유하게 됩니다.

메서드 체이닝을 통해 중간값을 별도로 메모리에 저장하지 않고, 연속적으로 호출하여 최종 결과값만 가져오도록 하였습니다. 체이닝을 통해 유지보수성이 줄어들었지만, 결론적으로 메모리 성능은 향상되었습니다.