기금넷 공식사이트 - 펀드 투자 - 빅데이터와 관련된 용어 선택

빅데이터와 관련된 용어 선택

빅데이터 관련 용어 선정

빅데이터와 데이터사이언스는 이제 대중에게 친숙한 용어가 되었고, 각계각층에서 빅데이터의 가치를 적극적으로 활용하고 발전시키고 있습니다. 엄청난 양의 데이터는 또한 엄청난 비즈니스 기회를 가져옵니다.

빅데이터 시대인 만큼 빅데이터에 대해 당연히 알아야 할 것이 있는데, 빅데이터와 함께 자주 등장하는 생소한 용어들을 알아보세요. 어휘력, 다음에 빅데이터 관련 글을 읽을 때 막히지 않을 거예요.

알고리즘

수학 용어에서 유래되었으며 제한된 수의 단계 내에서 데이터를 분석하는 특정 방법을 의미하며 일반적으로 소프트웨어에 의해 실행됩니다.

AIDC 자동 식별 기술

AIDC(자동 식별 및 데이터 캡처)는 메시지 데이터를 자동으로 읽어 컴퓨터에 입력하는 중요한 방법이자 수단입니다. 커뮤니케이션 기술을 기반으로 한 종합적인 과학기술입니다. 일반적인 AIDC에는 바코드, 자기 띠, 생체 인식, RFID 및 기타 기술이 포함됩니다.

AWS Amazon Web Services System

2006년 Amazon은 컴퓨팅, 스토리지, 데이터베이스, 분석, 애플리케이션 및 클라우드 컴퓨팅을 포함한 다양한 클라우드 컴퓨팅 서비스를 웹 서비스 형태로 기업에 제공하기 시작했습니다. 서비스를 배포합니다. 다양한 기업의 많은 과학자, 개발자 및 기술 인력이 현재 빅데이터 분석을 위해 AWS(Amazon Web Services)를 사용하고 있습니다.

Avro 직렬화 시스템

Avro는 Hadoop의 하위 프로젝트로, 대량의 데이터 교환을 지원하도록 설계된 데이터 직렬화 시스템(Data Serialization System)입니다.

행동 분석

행동 분석은 과학적인 방법을 사용하여 환경 자극과 행동 사이의 인과관계를 분석하고, 체계적인 관찰을 통해 행동 변화의 원리를 이해한 후, 학습, 형성 또는 행동 변화를 달성하기 위해 자극을 체계적으로 조작하는 것입니다. 간단히 말하면, 체계적인 방법을 사용하여 대상의 성과 행태를 분석하기 위해 객관적인 데이터를 관찰, 측정, 수집하는 것입니다.

빅데이터(Big Data) 빅데이터

빅데이터(또는 빅데이터)는 이름 그대로 데이터베이스의 양이 엄청나게 많은 경우를 말한다. 시스템이 이를 합리적인 시간 내에 저장하고 계산하지 못하고 처리하여 해석 가능한 정보로 분석하는 것을 빅데이터라고 합니다. 더 자세한 내용이 궁금하시다면 "거대한 데이터 시대, '크다, 빠르다, 복잡하다, 의심스럽다'라는 4자 모토를 활용해 빅데이터를 이해하는 데 도움을 주세요"와 "빅데이터의 7가지 정의"를 참고하시기 바랍니다. 너는 알아야 해."

BI 비즈니스 인텔리전스

BI(비즈니스 인텔리전스)는 최신 데이터 웨어하우징 기술, 온라인 분석 및 처리 기술, 데이터 마이닝을 사용하여 데이터 분석을 한 후 이를 비즈니스 가치를 달성하기 위한 그래픽 인터페이스 또는 보고서.

Cassandra 데이터베이스 시스템

은 Apache Software Foundation의 오픈 소스 분산 NoSQL 데이터베이스 시스템으로, 뛰어난 확장성과 성능으로 인해 대용량의 정형 데이터를 관리하는 데 적합합니다. Digg, Twitter, Hulu 및 Netflix와 같은 잘 알려진 웹 사이트에서 사용됩니다.

CDR 통화 세부 기록

CDR(Call Detail Record)은 통화 시간, 통화 시간, 기타 정보 등 통신 네트워크 사용 기록입니다. CDR은 통신 사업자와 기업이 네트워크 운영과 고객 행동을 분석하는 중요한 리소스입니다.

클릭스트림 분석 클릭스트림 분석

클릭스트림(Clickstream)은 웹페이지 간을 오가는 사용자의 클릭에 대한 기록으로, 업스트림(Upstream), 즉 이 웹사이트에 들어오는 클릭으로 나눌 수도 있습니다. . "소스" 및 다운스트림 - 이 웹사이트를 방문한 후의 "대상"입니다. 온라인 마케팅 및 검색 엔진의 경우 클릭 스트림 분석은 매우 중요한 참고 자료입니다.

클라우드 컴퓨팅

클라우드 컴퓨팅은 데이터, 도구, 프로그램을 인터넷에 올려 처리하는 것을 의미하는 분산 컴퓨터입니다. 네트워크의 여러 컴퓨터가 동시에 한 가지 작업을 수행하므로 처리 속도가 크게 향상될 수 있습니다.

모든 정보는 인터넷이라는 가상 공간에 담겨 있기 때문에 엔지니어들이 회로도를 그릴 때 이 가상 공간을 표현하기 위해 클라우드를 사용하는 경우가 많아 '클라우드'라는 이름이 붙었습니다.

데이터 마이닝

이름에서 알 수 있듯이, 마치 거친 돌 더미에서 귀중한 광물맥을 찾아 지구상의 지구물리학적 탐사를 하는 것과 같습니다. 알려지지 않은 귀중한 잠재적 정보를 추출합니다.

데이터 모델링

정보 시스템의 데이터 모델(데이터 모델)은 형식, 정의 및 속성, 데이터와 데이터 간의 관계를 포함하여 데이터가 표현, 저장 및 액세스되는 방식을 나타냅니다. 제한 사항이 있으며 데이터 스키마의 설계 프로세스를 "데이터 모델링"이라고 합니다.

데이터 시각화 데이터 시각화

는 데이터의 시각적 표현에 대한 연구입니다. 데이터 시각화 기술은 다양한 배경을 가진 엔지니어들이 의사소통하고 이해하여 좋은 설계 및 분석 결과를 얻을 수 있도록 도와줍니다.

데이터 전문가 데이터 전문가

데이터 전문가는 데이터를 사용하여 연구하고 평가할 수 있는 전문가입니다. 데이터 분석가, 데이터 과학자, 데이터 설계자 등을 모두 데이터 전문가로 분류할 수 있습니다. , 직무 내용에 대한 자세한 내용은 "데이터 분석가-과학자-건축가-빅 데이터 인재의 직무 내용 및 연봉 비교"를 참조하십시오.

탐색적 데이터 분석

탐색적 데이터 분석은 데이터의 구조와 특성을 찾아내고, 표준적인 프로세스와 방법이 없는 상태에서 기존 데이터를 탐색하는 것을 말합니다. , 이 데이터 분석 방법은 엄격한 패턴 확인보다는 탐색적 분석을 강조합니다.

Hadoop 기술

Hadoop은 대용량 데이터를 저장하고 관리할 수 있는 클라우드 플랫폼으로 Apache Software Foundation의 오픈 소스, 커뮤니티 기반, 완전 무료 소프트웨어입니다. . Hadoop의 두 가지 핵심 기능은 데이터를 저장하고 처리하는 데 사용되는 분산 파일 시스템 HDFS와 MapReduce 병렬 컴퓨팅 아키텍처입니다. Hadoop은 빅데이터 저장 및 빅데이터 분석에 널리 사용되며 빅데이터의 주류 기술로 자리잡고 있습니다. 더 자세한 내용이 궁금하시다면 "빅데이터의 노란꼬마코끼리 도우미 이해하기 – Hadoop"을 참고하세요.

사물 인터넷

사물 인터넷(Iots)은 데이터 수집 및 통신 기능을 통해 물리적 사물과 가상 사물을 연결하는 글로벌 네트워크 인프라입니다. 사물 인터넷은 모든 정보의 제어, 감지, 식별 및 교환을 위한 특정 메커니즘을 통해 모든 장치를 함께 연결할 수 있습니다.

NoSQL 데이터베이스 시스템

NoSQL은 원래 "No SQL"을 지칭했는데, 이는 SQL을 쿼리 언어로 사용하지 않는 데이터베이스 시스템으로 알려져 있습니다. 그러나 최근에는 NoSQL을 일반적으로 "SQL이 아닌"이라는 의미로 "Not Only SQL"로 간주합니다. SQL의 장점을 결합하고 관계형 데이터베이스와 NoSQL 데이터베이스를 혼합하여 최상의 저장 효과를 달성할 것으로 기대됩니다.

대량의 데이터가 주도하는 추세에 따라 다양한 형태의 NoSQL 데이터베이스가 생겨났고, 그중 MongoDB는 가장 잘 알려진 NoSQL 데이터베이스 소프트웨어 중 하나입니다.

예측 분석

예측 모델, 머신러닝, 데이터 마이닝 및 기타 기술을 사용하여 기존 및 과거의 사실 데이터를 분석하여 미래를 예측하는 데이터 분석 방법을 말합니다.

R 언어

R은 Matlab 및 SAS와 유사하게 통계 계산 및 그리기 기능을 제공하는 오픈 소스 통계 소프트웨어입니다. R은 무료이고 사용하기 쉬울 뿐만 아니라 최근 몇 년 동안 널리 사용되는 데이터 도구입니다. 과학계에서 중요한 도구입니다.

SaaS Software as a Service

SaaS(Software-As-A-Service)는 인터넷 기술과 응용 소프트웨어의 성숙과 함께 등장한 소프트웨어 응용 모델입니다. SaaS 공급자는 소프트웨어를 자체 서버에 균일하게 배포하고 인터넷을 통해 고객에게 소프트웨어를 제공하므로 고객은 소프트웨어를 구매할 필요가 없고 필요에 따라 공급자에게 필요한 서비스를 주문하며 고객은 소프트웨어를 유지할 필요가 없습니다. 서비스 제공자는 소프트웨어를 관리하고 유지할 수 있는 모든 권한을 가지며, 소프트웨어 제조업체는 고객에게 인터넷 애플리케이션을 제공하고 소프트웨어의 오프라인 작동 및 로컬 데이터 저장도 제공하므로 고객은 언제 어디서나 주문한 소프트웨어와 서비스를 사용할 수 있습니다. .

많은 중소기업에게 SaaS는 고급 기술을 채택하는 가장 좋은 방법으로 기업이 인프라와 애플리케이션을 구매, 구축, 유지 관리할 필요가 없습니다.

테라바이트(1 000 000 000 000바이트)

TB는 테라바이트로, 데이터 볼륨을 분류한 것으로 10^12바이트에 해당합니다.

기타 데이터 볼륨 분류는 다음과 같습니다:

바이트(8비트)

킬로바이트(1000바이트)

메가바이트(1 000 000바이트)

기가바이트(1,000,000,000바이트)

테라바이트(1,000,000,000,000바이트)

페타바이트(1,000,000,000,000,000바이트)

엑사바이트(1 000 000 000 000 000 000바이트)

제타바이트(1 000 000 000 000 000 000 000바이트)

요타바이트(1 000 000 000 000 000 000 000 000바이트) )

위 내용은 빅데이터와 관련된 용어를 선별하여 편집자가 공유한 관련 내용입니다. 자세한 내용은 Global Ivy를 팔로우하여 더 유용한 정보를 공유할 수 있습니다.