본문 바로가기

컴퓨터 일반/IT용어122

인공 신경망(Artificial Neural Network, ANN) 사람 또는 동물 두뇌의 신경망에 착안하여 구현된 컴퓨팅 시스템의 총칭. 기계 학습(machine learning)의 세부 방법론 중 하나로, 신경 세포인 뉴런(neuron)이 여러 개 연결된 망의 형태이다. 구조 및 기능에 따라 여러 종류로 구분되며, 가장 일반적인 인공 신경망은 한 개의 입력층과 출력층 사이에 다수의 은닉층(hidden layer)이 있는 다층 퍼셉트론(multi-layer perceptron)이다. 인공 신경망은 하드웨어로 구현될 수도 있으나, 주로 컴퓨터 소프트웨어로 구현된다. 인공 신경망은 기초 컴퓨팅 단위인 뉴런 여러 개가 가중된 링크(weighted link)로 연결된 형태이다. 가중된 링크(weighted link)는 주어진 환경에 적응할 수 있도록 가중치를 조정할 수 있다... 2022. 8. 8.
튜링 시험(Turing test) 컴퓨터가 지능이 있는지를 판별할 수 있는 시험. 조사관이 블라인드 상태에서 컴퓨터와 글로 대화를 나눈 후, 대화 상대가 사람인지 컴퓨터인지 판단할 수 없게 되면 컴퓨터는 지능이 있는 것으로 튜링 시험에 합격 판정을 받는다. 앨런 튜링(Alan Turing)이 1950년 컴퓨터 지능의 운영 정의(operational definition)를 위해 튜링 시험을 고안하여 논문에서 제안하였다(※논문: Turing, A.M., Computing machinery and intelligence, Mind, 59(236):433-460, 1950). 튜링 시험은 컴퓨터가 사람처럼 신체 동작하는 것은 지능과 관련이 없다는 전제하에, 사람이 사용하는 언어(자연어)를 이용한다. 최초의 튜링 시험에서는 사람인 조사관이 블라인.. 2022. 8. 5.
노에스큐엘(non SQL, NoSQL) 빅 데이터 처리을 위한 비관계형 데이터베이스 관리 시스템(DBMS). 전통적인 관계형 데이터베이스 관리 시스템(RDBMS)와는 다르게 설계된 비관계형(non-relational) DBMS로, 대규모의 데이터를 유연하게 처리할 수 있는 것이 강점이다. 노에스큐엘(NoSQL)은 테이블-컬럼과 같은 스키마 없이, 분산 환경에서 단순 검색 및 추가 작업을 위한 키 값을 최적화하고, 지연(latency)과 처리율(throughput)이 우수하다. 그리고 대규모 확대가 가능한 수평적인 확장성의 특징을 가지고 있다. NoSQL에 기반을 둔 시스템의 대표적인 예로는 아파치 카산드라(Apache Cassandra), 하둡(Hadoop), 몽고디비(MongoDB) 등이 있다. 출처] 한국정보통신기술협회 : 노에스큐엘 대한.. 2022. 7. 25.
관계형 데이터베이스 관리 시스템(RDBMS : Relational Database Management System) 행과 열로 된 2차원이나 3차원의 표로 데이터를 표현하는 데이터베이스 관리 시스템. 대규모 컴퓨터 시스템을 대상으로 한 많은 이용자가 대량의 데이터를 다룰 때 데이터베이스를 관리하는 시스템이다. PC용 데이터베이스에 비하여 데이터를 대량으로 취급할 수 있고 신뢰성 측면에서도 뛰어난 업무 시스템을 구축할 수 있다. 구조화된 질의 언어(SQL)로 작성된 데이터 조작용 명령에 따라 서버상의 데이터를 조작할 수 있으며, 수정 등의 명령을 서버로 보낼 수 있는 것이면 어떤 클라이언트에서도 서버의 데이터를 조작할 수 있다. 출처] 한국정보통신기술협회 : 관계형 데이터베이스 관리 시스템 대한민국의 아름다운 영토, 독도의 봄 2022. 7. 18.
데이터베이스 관리 시스템(Database Management System, DBMS) 데이터베이스(DB)에 접근(access)하여 데이터베이스 정의, 조작, 제어 등 데이터베이스 관리를 지원하는 소프트웨어. 데이터베이스 관리 시스템(DBMS: Database Management System)은 데이터베이스에 적재된 데이터 작업을 수행할 뿐만 아니라 데이터베이스를 보호하고 보안을 제공한다. 데이터베이스 관리 시스템의 기능은 크게 구성(정의), 조작, 제어 기능으로 나눌 수 있다. - 구성(정의) 기능 : 데이터베이스에 저장될 자료의 구조와 응용 프로그램이 이 구조를 이용하는 방식을 정의하는 기능. 레코드 구조의 정의, 데이터 모형의 정의, 물리적 구조의 정의 등을 포함한다. - 조작 기능 : 사용자의 요구에 따라 데이터베이스에 접근하여 저장된 자료를 검색, 갱신, 삽입, 삭제할 수 있도록 .. 2022. 7. 11.
데이터베이스 스키마( Database Schema ) 데이터베이스(DB: database)에서 데이터 구조와 그 표현법, 자료 간의 관계를 형식 언어로 정의한 것. 데이터베이스 스키마(database schema)는 데이터베이스(Database) 전체 또는 일부의 논리적인 구조를 표현하는 것으로 데이터베이스 내에서 데이터가 어떤 구조로 저장되는지를 나타낸다. 데이터베이스 스키마는 데이터 사전(data dictionary)에 저장하며 현실 세계의 단면을 추상화하는 모델링 과정을 통하여 만들어진다. 데이터베이스 스키마는 대부분의 상용 데이터베이스 관리 시스템(DBMS)에서 사용하는 안시/스파크(ANSI/SPARC) 모델의 3층 스키마 구조(three-schema architecture)에 따라 외부 스키마, 개념 스키마, 내부 스키마로 구분한다. - 외부 스키.. 2022. 7. 4.
구조화된 질의 언어(SQL : Structured Query Language) 관계형 데이터베이스 관리 시스템(RDBMS) 또는 관계형 데이터 스트림 관리 시스템(RDSMS)의 조작과 관리를 위한 표준 질의 언어. 일반적으로 기업 등 조직은 조직 내에서 생산하는 데이터를 효율적으로 저장하고 관리하며 사용하기 위하여 관계형 데이터베이스 관리 시스템(RDBMS)을 사용한다. 이 시스템에 접근하여 데이터를 저장하고 호출하거나, 수정하고 삭제하는 데에 구조화된 질의 언어(SQL: Structured Query Language)를 사용한다. 구조화된 질의 언어(SQL)는 1970년대에 미국 IBM사가 최초로 개발하였으며, 국제표준으로 채택된 이후 ISO/IEC JTC 1 SC32(Data management and interchange) WG3에서 지속적인 개정과 보완을 담당하고 있다. 처.. 2022. 6. 27.
데이터베이스(DataBase, DB) ① 주어진 목적이나 주어진 자료 처리 시스템에 사용하기에 적합하도록 자료를 구조화하여 자료 검색 및 갱신을 효율화한 자료의 집합. ② 여러 사람이 공유하여 사용할 목적으로 통합하여 관리되는 데이터의 집합 또는 여러 응용 시스템들의 통합된 정보들을 저장하여 운영할 수 있는 공용 데이터들의 묶음. 일반적으로 데이터베이스(DB)는 서로 관련 있는 데이터들의 집합이다. 중복된 데이터를 제거할 뿐 아니라 데이터를 구조화하여 효율적인 처리가 가능하도록 관리할 수 있어 금융, 전자상거래, 웹 애플리케이션, 게임 등 다양한 분야에 사용된다. 파일 시스템(file system)으로 데이터를 관리하면 중복 데이터 발생과 이들 간의 데이터 불일치 등 데이터 무결성(data integrity, 데이터가 불법으로 변형되거나 손.. 2022. 6. 13.
데이터 시각화(Data Visualization) 정보와 데이터를 도표, 그래프, 지도와 같은 시각적인 요소들을 사용하여 쉽고 효과적으로 이해할 수 있게 표현하는 절차 또는 기술. 단순 통계치나 복잡한 표로 만들어진 데이터는 이해하기가 쉽지 않을뿐더러 이를 기초로 한 신속한 의사결정을 내리기 어렵다. 데이터 시각화(data visualization)는 데이터의 의미나 분석 결과를 사용자가 쉽게 이해할 수 있도록 다음의 방법들을 주로 사용한다. - 시간 시각화 : 시간에 따른 데이터의 변화를 시각적으로 표현하는 방법(예 : 누적 막대 그래프) - 분포 시각화 : 데이터를 전체 관점에서 부분들의 분포로 시각적으로 표현하는 방법(예 : 원 그래프) - 관계 시각화 : 데이터 세트 간의 유사성, 상관관계를 표현하는 방법(예 : 산점도, 버블 차트) - 비교 시.. 2022. 6. 6.
맵리듀스( MapReduce) 분산 컴퓨팅(distributed computing)에서 대용량 데이터를 병렬 처리(parallel processing)하기 위해 개발된 소프트웨어 프레임워크(framework) 또는 프로그래밍 모델. 맵리듀스(MapReduce)는 구글이 수집한 문서와 로그 등 방대한 데이터들을 분석하기 위해 2004년에 발표한 소프트웨어 프레임워크다. 맵리듀스는 방대한 입력 데이터를 분할하여 여러 머신들이 분산 처리하는 맵(Map) 함수 단계와 이를 다시 하나의 결과로 합치는 리듀스(Reduce) 함수 단계로 나뉜다. 다음은 맵리듀스를 이용한 단어 수 세기(word count) 처리 과정 예시다. 1. 입력(input) : 파일을 입력한다. 2. 분할(splitting) : 입력한 파일 값을 라인 단위로 분할한다. 3.. 2022. 5. 30.
하둡(Hadoop) 대용량 데이터 분산 처리 플랫폼(High-availability distributed object-oriented platform)의 약자로 다수의 범용 컴퓨터를 연결하여 하나의 시스템처럼 작동하도록 묶어 대용량의 다양한 데이터들을 분산 처리하는 공개 소스 프레임워크(소프트웨어 패키지). 하둡(hadoop)은 2005년 더그 커팅(Doug Cutting)과 마이크 케퍼렐라(Mike Cafarella)가 오픈 소스 검색 엔진인 아파치 너치(Apache Nutch)를 분산 처리하기 위하여 개발하였다. 하둡이라는 이름은 개발자인 더그(Doug)의 아들이 갖고 있던 노란 코끼리 장난감의 이름을 따서 지었다. 이후 개발한 하둡 에코시스템(ecosystem) 프로그램들은 하이브(hive, 데이터 모델링 솔루션), .. 2022. 5. 23.
알 언어(R language) 빅데이터 분석(big data analytics)과 데이터 시각화(data visualization)에 특화된 플랫폼에 독립적인 프로그래밍 언어이자 오픈 소스(open source) 소프트웨어. 알(R) 언어는 1992년 처음 뉴질랜드 오클랜드에서 Robert Gentleman, Ross Ihaka 교수가 개발을 시작하였으며, 2000년에 R 1.0.0 버전이 배포되었다. 현재는 R 개발 핵심팀(R Development Core Team)이 개발을 담당하여 지속적으로 성능을 개선하고, 새로운 기능들을 추가하고 있다. 알(R) 언어는 플랫폼에 독립적인 언어로 모든 운영 체제에서 쉽게 사용할 수 있다. 그누(GNU) 소프트웨어 중 하나로 공용 사용권(GPL: General Public License)을 제공.. 2022. 5. 16.
반응형