본문 바로가기

컴퓨터 일반150

텍스트 마이닝(Text Mining) 텍스트 데이터에서 가치와 의미가 있는 정보를 찾아내는 기법.많은 정보들이 온라인 뉴스 기사, 기술문서, 도서, 전자 우편(이메일) 메시지, 마이크로 블로그(micro-blog), 소셜 네트워킹 서비스(SNS) 및 웹페이지와 같은 텍스트 형식으로 저장된다. 이렇게 공개된 다양하고 풍부한 텍스트 정보에서 특정 주제와 관련한 부분을 뽑아 의미를 분석하고 사회 현상이나 여론의 경향 등 고품질의 정보를 도출하기 위한 방법으로 텍스트 마이닝 기법을 활용한다. 텍스트 마이닝(text mining)의 기반 기술로는 대용량 텍스트 데이터를 저장하고 처리하는 빅데이터 기술과 텍스트 데이터 구조를 분석하고 포함된 정보를 통계 처리가 가능한 형태로 변환하는 자연어 처리(NLP: Natural Language Processin.. 2022. 4. 11.
소셜 미디어 마이닝(Social Media Mining) 소셜 미디어(social media)의 데이터를 분석하여 대중의 성향과 패턴 등을 분석하는 기법. 소셜 미디어에서 소비자가 직접 만들어 인터넷에 축적된 소셜 미디어 데이터를 분석하면 집단 지성에 기반한 사회 경향, 여론 변화나 사회적 흐름을 파악할 수 있다. 소셜 미디어 마이닝(social media mining)은 기업이 하는 의사 결정이나 마케팅 전략 수립, 고객 관리, 금융, 교육, 환경 등 여러 산업 분야에 적용할 수 있다. 예를 들어, 패션 업계에서는 사용자 댓글을 분석하여 유행할 만한 디자인의 옷을 개발하거나 자주 언급되는 여배우를 마케팅에 섭외할 수 있다. 소셜 미디어 마이닝에 사용되는 데이터는 사용자의 미디어 정보 사용 시간, 유사 미디어 조회 수, 미디어 공유 수 등의 정형 데이터(str.. 2022. 4. 4.
데이터 마이닝(Data Mining) 대용량 데이터에서 의미 있는 통계적 패턴이나 규칙, 관계를 찾아내 분석하여 유용하고 활용할 수 있는 정보를 추출하는 기술. 지하에 묻힌 광물을 찾아낸다는 뜻의 마이닝(mining)은 탄광에서 석탄을 캐거나 대륙붕에서 원유를 채굴하는 작업처럼 데이터에서 숨겨진 가치를 찾아낸다는 동일한 특징 때문에 데이터 분석 용어로 사용한다. 데이터 마이닝(data mining)은 학문적으로는 통계, 전산, 경영 등 다양한 데이터 분석 관련 학문의 융합으로 탄생한 융합 학문이다. 기술적으로 데이터 마이닝에는 대용량 데이터를 효율적으로 저장하고 및 관리하는 기법인 데이터베이스, 데이터 창고(DW: Data Warehouse), 데이터 마트(data mart) 등과 방대한 규모의 데이터를 분석하는 분산 처리 기술 등이 사용된.. 2022. 3. 28.
크롤링(Crawling) 웹 사이트(web site), 하이퍼링크(hyperlink), 데이터(data), 정보 자원을 자동화된 방법으로 수집, 분류, 저장하는 것. 크롤링을 위해 개발된 소프트웨어를 크롤러(crawler)라 한다. 크롤러는 주어진 인터넷 주소(URL)에 접근하여 관련된 URL을 찾아내고, 찾아진 URL들 속에서 또 다른 하이퍼링크(hyperlink)들을 찾아 분류하고 저장하는 작업을 반복함으로써 여러 웹 페이지를 돌아다니며 어떤 데이터가 어디에 있는 지 색인(index)을 만들어 데이터베이스(DB)에 저장하는 역할을 한다. 크롤링과 유사한 개념으로 소프트웨어를 통해 대상 웹사이트와 같은 데이터 소스에서 데이터 자체를 추출하여 특정 형태로 저장하는 스크레이핑(scraping) - 데이터 스크레이핑(data scr.. 2022. 3. 21.
마이데이터(MyData) 정보 주체를 중심으로 산재된 개인데이터를 한 곳에 모아 개인이 직접 열람하고 저장하는 등 통합 관리하고, 이를 활용하는 일련의 과정. 마이데이터는 자신에 관한 정보가 언제 누구에게 어느 범위까지 알려지고 또 이용되도록 할 것인지를 개인이 스스로 결정할 수 있는 권리인 '개인정보자기결정권'과 제3자에게 이를 관리할 수 있도록 허용하는 '개인정보이동권'을 기반으로 한다. 개인에게 ‘개인정보자기결정권’을 보장하는 기본 원칙은 다음과 같다. - 개인은 언제든지 본인의 개인데이터에 접근할 수 있고, 그 데이터를 제3자에게 보내거나 활용하게 할 수 있다. - 개인이 개인데이터를 요청하면 개인데이터 보유자는 해당 데이터를 안전하고 쉽게 이용할 수 있는 형식으로 개인에게 제공해야 한다. - 개인데이터를 사용하고자 하는.. 2022. 3. 17.
데이터 활용능력(Data Literacy) 데이터 안의 정보를 이해하여 활용하는 능력. 리터러시(literacy)가 글을 읽고 해독하는 능력을 의미하는 바와 같이 데이터 리터러시(data literacy)는 데이터를 읽고 해석할 수 있는 능력을 말하며, 더 나아가 데이터를 목적에 맞게 활용하는 모든 기술적인 능력을 포함한다. 데이터 활용 능력(data literacy)은 단순히 통계 데이터를 읽고 해석하여 결론을 도출하는 능력과 구별한다. 여기에는 다양한 유형의 데이터를 수집하고 컴퓨터로 처리하는 능력, 컴퓨터 프로그램으로 미래 결과를 예측하는 능력 등도 포함한다. 데이터 활용 능력에 있는 주요한 하위 역량으로 데이터 수집 능력, 데이터 시각화 능력, 데이터 가공 능력, 데이터 분석 능력, 데이터 기획 능력, 데이터 관리 능력이 있다. 4차 산업.. 2022. 3. 11.
데이터 과학(Data Science) 데이터를 수집/분석/처리하여 유의미한 정보를 추출하고 활용하는 과학적 방법론, 프로세스, 시스템 등을 포함하는 학제 간 연구 분야. 데이터 과학이라는 용어는 1974년 덴마크의 컴퓨터 과학자 페테르 나우르(Peter Naur)가 쓴 『Concise Survey of Computer Methods』에서 처음으로 언급하였다. 나우르는 데이터 과학을 데이터를 다루는 과학으로 정의하였으나 데이터 수집(data collection), 저장(storing), 조작(manipulation) 등 데이터를 컴퓨터로 처리하는 데에만 집중하였다. 1990년대 말 데이터베이스(database)와 데이터 마이닝(data mining) 기술의 발전으로 데이터 과학이라는 용어가 주목을 받기 시작하였다. 2000년대에 들어 빅데이터.. 2022. 3. 2.
확장현실( eXtended Reality, XR) 혼합현실(MR) 기술을 망라하는 초실감형 기술 및 서비스. 확장현실(XR)은 가상현실(VR)과 증강현실(AR)을 아우르는 혼합 현실(MR) 기술을 망라하는 용어다. 가상현실(VR)이 360도 영상을 바탕으로 새로운 현실을 경험하도록 하는 기술이라면 증강현실(AR)은 실제 사물 위에 컴퓨터그래픽(CG)을 통해 정보와 콘텐츠를 표시한다. 증강현실(AR)과 가상현실(VR)은 별개이지만 이 두 기술은 각자 단점을 보완하며 상호 진화를 하고 있다. 그러나 현 단계에서는 차이가 분명히 드러난다. 가상현실(VR)은 눈 전체를 가리는 헤드셋 형(HMD) 단말기가 필요하고, 증강현실(AR)은 구글 글라스와 같은 안경으로 표현이 가능하다. 확장현실(XR)은 가상·증강현실(VR·AR) 기술의 개별 활용 또는 혼합 활용을 자.. 2022. 2. 22.
하이브리드 클라우드( Hybrid Cloud) 클라우드 구축 시 외부 인프라를 이용하는 ‘퍼블릭 클라우드’와 자체 인프라를 활용하는 ‘프라이빗 클라우드’ 또는 기업 내에 서버 설치·운영하는 ‘온 프레미스’가 조합된 서버 이용 환경 하이브리드 클라우드(hybrid cloud)는 하나 이상의 외부 퍼블릭 클라우드(public cloud)와 자체 인프라를 활용하는 프라이빗 클라우드(private cloud) 또는 온 프레미스(on-premise)가 조합된 환경이다. 기업 내 모든 정보기술(IT) 인프라를 회사 밖의 퍼블릭 클라우드로 옮기지 않고 수요에 필요한 기능에 따라 클라우드 서비스를 이용할 수 있다. 사내 IT 환경과 외부 클라우드를 결합하여 데이터와 응용 프로그램을 공유할 수 있도록 IT 환경을 구축한다. 클라우드를 사용하는 기업이 소유한 하드웨어.. 2022. 2. 15.
Log4j 보안 취약점 사태 ▶ Log4j란 Log4j는 Java/Kotlin/Scala/Groovy 코딩 도중에 프로그램의 로그를 기록해주는 라이브러리로, 이클립스, IntelliJ IDEA, 안드로이드 스튜디오 등에 추가해서 프로그램 실행 시 자동으로 지정한 경로에 로그를 저장해주는 기능을 한다. ▶ Log4j의 원리 하트블리드 사태와 비슷하게 이 취약점 사태 또한 여파와 다르게 취약점의 원리가 간단하다. 우선 이 취약점은 JNDI와 LDAP를 이용한다. JNDI는 Java Naming and Directory Interface의 약자로 1990년대 후반부터 Java에 추가된 인터페이스이다. Java 프로그램이 디렉토리를 통해 데이터(Java 객체 형태)를 찾을 수 있도록 하는 디렉토리 서비스이다. JNDI는 이러한 디렉토리 서.. 2022. 2. 8.
클라우드 PC(Cloud PC) 중앙 서버에 개인용 컴퓨터(PC) 환경을 구현하여 단말기에 구애받지 않고 원격으로 접속해 업무 처리가 가능한 PC 코로나19 확산을 방지하기 위하여 사회적 거리 두기로 재택근무가 확산되면서 클라우드 PC(cloud PC)가 주목받고 있다. 클라우드 PC는 중앙 서버에 개인용 컴퓨터(PC) 환경을 구현한 서비스다. 서버 기반 컴퓨팅(SBC: Server-Based Computing), 데스크톱 가상화(VDI: Virtual Desktop Infrastructure)라고도 한다. 데이터센터 등에 가상으로 데스크톱 PC 환경을 구현하는 기술이다. 임직원은 PC나 모바일 등 다양한 기기에서 할당받은 계정으로 클라우드 PC 서비스를 이용하여 업무를 처리할 수 있다. 클라이언트 PC나 단말기 사양이 낮아도 서버에서.. 2022. 2. 3.
캄테크(Calmtech) 사람이 인지하지 못한 상태에서 일상생활 환경에 센서, 컴퓨터, 네트워크 장비를 보이지 않게 내장해 각종 서비스를 제공하는 기술 캄테크는 조용함을 뜻하는 캄(calm)과 기술을 뜻하는 테크놀로지(technology) 합성어다. 1995년 미국 정보기술(IT) 연구 기업인 제록스파크의 소속 연구원 마크 와이저와 존 실리 브라운이 논문에서 처음 사용하였다. 캄테크는 평소에는 이용자가 인지하지 못할 정도로 존재를 드러내지 않는다. 그러다 필요함이 생길 때 정보를 제공한다. 그러나 이용자가 주의를 기울이거나 집중할 필요는 없다. 캄테크는 4차 산업혁명의 핵심인 빅데이터, 인공지능(AI), 사물인터넷(IoT) 등 첨단 기술을 기반으로 발전한다. 사람 위치와 온도를 감지해서 바람을 자동 조절하는 스마트 에어컨이나 보.. 2022. 1. 26.
반응형