
vectorDB HNSW 인덱싱 메모리 이슈 문제 실험 및 수치화HNSW 그래프가 메모리에 상주해야 하는 구조적 특성으로 인한 서비스 상의 문제점 정리환경설정production 환경과 비슷한 local 실험 환경 재구성OpenSearch cluster (3 node)호스트에 3개의 container로 opensearch cluster 생성Host : 11 core, 36GB1.2M document IndexedMetriccpu usage (1분간 점유한 코어 개수 평균)virtual memoryrss (physical memory allocated)file IOIndex Create"embedding": { "type": "knn_vector", "dimension": 1..

OpenSearch based Faiss HNSW 인덱싱벡터 인덱싱 시 그래프 구조가 디스크에 저장되며, 검색 시 메모리에 적재되는 방식 확인인덱싱 및 검색 시 파라미터가 메모리 사용량과 검색 성능(latency, accuracy) 직접적인 영향을 미침을 확인함m: 각 노드가 유지하는 연결(edge)의 수 → 높을수록 recall 상승, 메모리 사용 증가ef_construction: 인덱싱 시 그래프 탐색 폭 → 인덱스 정확도 상승, 인덱싱 시간 증가ef_search: 검색 시 탐색 범위 → 높을수록 정확도 상승, latency 증가dimension: 그래프 노드에 해당 벡터 값 저장 -> 높을수록 메모리 사용량 증가인덱싱 파라미터 (m, dimension) 가 메모리 사용량에 미치는 영향 분석노드 하나..

Instruction execution프로세스가 시작된 이후 CPU가 프로그램을 실행할 때의 순서프로세스를 위한 메모리 초기화file -> memory code segment loadrip를 메모리 code의 entry point로 이동instruction 실행PCB (Process Control Block)운영체제는 여러 프로세스를 동시에 실행해야 하므로, 실행 중인 프로세스를 전환할 때마다 현재 프로세스의 상태를 저장해야 한다. 이를 PCB(Process Control Block) 에 저장하며, PCB는 커널 영역의 메모리에 위치한다.PCB에는 다음과 같은 정보가 포함된다.프로세스 ID (PID): 프로세스 고유 식별자프로세스 상태 (Process State): 실행(Running), 대기(Waiti..

백준이나 프로그래머스에서 코딩테스트를 준비해본 경험이 있을까요?PS 사이트에서는 알고리즘의 효율성을 기준으로 점수를 매기게 되는데요,시간 복잡도 : 얼마나 적은 연산을 했나 (실행시간)공간 복잡도 : 얼마나 적은 메모리를 사용했나가끔 이런 상황이 생길 때가 있어요.문제 상황def solution(n, stations, w): answer = 0 start = 1 for station in stations: count = station - w - start if count > 0: answer += math.ceil(count / (2 * w + 1)) start = station + w + 1 if start 디버깅을 위해 ..
- Total
- Today
- Yesterday
- 코딩
- FastAPI
- 시간 초과
- 뿌요뿌요
- 토이프로젝트
- 싸지방
- 구름ide
- os
- io blocking
- 리눅스
- vector search
- Python
- letsencrypt
- OpenSearch
- 백준
- 웹IDE
- 정보보호병
- pintos
- react
- C
- 해커톤
- ttyd
- 분할 정복
- Web
- 사이버정보지식방
- codeanywhere
- 프로젝트
- 뿌요뿌요 테트리스
- pvm
- HNSW
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |