온라인 학습 머신 러닝 | 머신러닝 온라인 교육 1편 – 머신러닝의 기초 개념을 잡아봅시다 모든 답변

당신은 주제를 찾고 있습니까 “온라인 학습 머신 러닝 – 머신러닝 온라인 교육 1편 – 머신러닝의 기초 개념을 잡아봅시다“? 다음 카테고리의 웹사이트 https://you.charoenmotorcycles.com 에서 귀하의 모든 질문에 답변해 드립니다: https://you.charoenmotorcycles.com/blog. 바로 아래에서 답을 찾을 수 있습니다. 작성자 ailys 이(가) 작성한 기사에는 조회수 206회 및 좋아요 7개 개의 좋아요가 있습니다.

Table of Contents

온라인 학습 머신 러닝 주제에 대한 동영상 보기

여기에서 이 주제에 대한 비디오를 시청하십시오. 주의 깊게 살펴보고 읽고 있는 내용에 대한 피드백을 제공하세요!

d여기에서 머신러닝 온라인 교육 1편 – 머신러닝의 기초 개념을 잡아봅시다 – 온라인 학습 머신 러닝 주제에 대한 세부정보를 참조하세요

머신러닝, 딥러닝, 통계, 인공지능 기술과의 관계는 무엇일까요?
인간의 학습과 컴퓨터의 학습은 어떤 차이가 있을까요?
머신러닝으로 로또 번호를 예측할 수 있을까요?
머신러닝은 어느 분야에서 어떻게 활용될까요?

온라인 학습 머신 러닝 주제에 대한 자세한 내용은 여기를 참조하세요.

머신러닝-1.2. 배치 학습과 온라인 학습

배치 학습과 온라인 학습 지난 포스트에서는 학습 데이터를 어떻게 입력하는지에 따라 분류되는 지도 학습, 비지도 학습, 준지도 학습, 강화 학습에 …

+ 여기에 표시

Source: gooopy.tistory.com

Date Published: 6/14/2022

View: 6407

[ML] 머신러닝 시스템의 종류 (2) – 배치 학습, 온라인 학습

온라인 학습에서는 데이터를 순차적으로 한 개씩 또는 미니배치(Mini-Batch)라 부르는 작은 묶음 단위로 주입하여 시스템을 훈련시킵니다.

+ 더 읽기

Source: stickie.tistory.com

Date Published: 4/25/2021

View: 7621

머신러닝 – 배치학습 vs 온라인학습

2. 온라인 학습(Online learning) · 데이터를 순차적으로 한개씩 또는 미니배치(mini-batch)라 부르는 작은 묶음 단위로 주입하여 시스템을 훈련 · 매 학습 …

+ 여기에 표시

Source: rosypark.tistory.com

Date Published: 2/26/2021

View: 793

앤드류 응의 머신러닝(17-5): 온라인 학습 알고리즘 – 브런치

온라인 강의 플랫폼 코세라의 창립자인 앤드류 응 (Andrew Ng) 교수는 인공지능 업계의 거장입니다. 그가 스탠퍼드 대학에서 머신 러닝 입문자에게 한 …

+ 여기에 표시

Source: brunch.co.kr

Date Published: 11/4/2021

View: 8195

[ML] 오프라인 학습과 온라인 학습이란? – 우노

온라인 학습은, 학습된 모델이 제품 시스템에 적용된 상태에서도, 적은 양의 데이터셋으로 점진적으로 모델을 추가적으로 학습할 수 있는 것을 의미 …

+ 여기에 표시

Source: wooono.tistory.com

Date Published: 5/10/2022

View: 7500

배치 학습(오프라인 학습)과 온라인 학습 비교 – 끝내주게 숨쉬기

머신러닝은 입력 데이터의 스트림(stream)으로부터 점진적으로 학습할 수 있는지에 따라 배치학습 또는 온라인학습으로 분류될 수 있습니다.

+ 여기에 표시

Source: abluesnake.tistory.com

Date Published: 9/1/2022

View: 6152

[논문]온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 …

This study is a case study that applies plant ification learning using machine learning to fourth graders in elementary school in online learning …

+ 여기를 클릭

Source: scienceon.kisti.re.kr

Date Published: 2/25/2022

View: 671

[핸즈온 머신러닝 정리] 1장. 배치 학습과 온라인 학습

배치 학습과 온라인 학습. 찬’story 2021. 6. 26. 22:42. 앞 포스팅에서 머신러닝을 지도 학습, 비지도 학습, 강화 학습으로 나누어 보았다. 이는 ‘학습하는 동안의 …

+ 더 읽기

Source: changeslife.tistory.com

Date Published: 3/20/2021

View: 4289

머신러닝 시스템 종류(batch vs online learning – 네이버 블로그

온라인 학습은 연속적으로 데이터를 받고(예를 들면 주식가격) 빠른 변화에 스스로 적응해야 하는 시스템에 적합합니다. 컴퓨팅 자원이 제한된 경우에도 …

+ 여기에 더 보기

Source: m.blog.naver.com

Date Published: 8/22/2022

View: 5170

온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습 …

A Case Study on the Application of Plant Classification Learning for 4th Grade Elementary School Using Machine Learning in Online Learning – online learning …

+ 여기에 더 보기

Source: www.kci.go.kr

Date Published: 8/2/2021

View: 5735

주제와 관련된 이미지 온라인 학습 머신 러닝

주제와 관련된 더 많은 사진을 참조하십시오 머신러닝 온라인 교육 1편 – 머신러닝의 기초 개념을 잡아봅시다. 댓글에서 더 많은 관련 이미지를 보거나 필요한 경우 더 많은 관련 기사를 볼 수 있습니다.

머신러닝 온라인 교육 1편 - 머신러닝의 기초 개념을 잡아봅시다
머신러닝 온라인 교육 1편 – 머신러닝의 기초 개념을 잡아봅시다

주제에 대한 기사 평가 온라인 학습 머신 러닝

  • Author: ailys
  • Views: 조회수 206회
  • Likes: 좋아요 7개
  • Date Published: 2021. 11. 1.
  • Video Url link: https://www.youtube.com/watch?v=cnn-nHpQPFE

머신러닝-1.2. 배치 학습과 온라인 학습

728×90

반응형

배치 학습과 온라인 학습

지난 포스트에서는 학습 데이터를 어떻게 입력하는지에 따라 분류되는 지도 학습, 비지도 학습, 준지도 학습, 강화 학습에 대해 알아보았다.

이번 포스트에서는 실시간으로 학습이 가능한지 여부에 따라 나뉘는 배치 학습과 온라인 학습에 대해 알아보도록 하겠다.

1. 배치 학습(Batch learning)

배치 학습은 한번에 모든 훈련 데이터를 학습시키는 방법으로, 시간과 자원을 많이 소모하므로, 일반적으로 오프라인 환경에서 수행되므로, 오프라인 학습(Offline learning) 이라고도 한다.

이라고도 한다. 학습은 런칭 전에 일어나고, 제품에 학습된 내용을 적용하면, 더 이상의 학습 없이 사용만 된다.

새로운 데이터가 등장하여, 머신을 재학습 하고자 하는 경우, 이전 데이터에 새로운 데이터를 포함한 전체 데이터를 학습시키고, 학습된 새로운 모델을 사용해야 한다.

이전 포스트( “머신러닝-1.0. 전통적인 기법과 머신러닝의 차이”

그러나, 빅데이터에 대하여, 머신러닝 알고리즘을 사용하는 경우, 그 데이터의 양이 지나치게 많기 때문에 학습 시간이 작게는 몇 시간에서 길게는 몇 주, 한 달 이상의 시간이 소모될 수도 있기 때문에 쉬운 작업은 아니다.

데이터의 양이 매우 많아 학습 시간이 지나치게 길거나, 탐사 로봇 같이 자원이 지나치게 한정된 상황, 주식 가격표 같은 실시간 반영이 필요한 상황에서는 배치학습이 아닌 능동적인 학습이 필요하다.

2. 온라인 학습(Online learning)

온라인 학습은 일반적으로, 학습이 끝나 제품화가 된 모델에 대하여, 미니배치(Mini-batch) 라 부르는 작은 묶음 단위의 데이터를 주입하여 모델을 학습시키는 방법이다.

라 부르는 작은 묶음 단위의 데이터를 주입하여 모델을 학습시키는 방법이다. 미니 배치의 크기가 작기 때문에 학습 단계가 빠르고 비용이 적게 들기 때문에 모델은 데이터가 도착하는 대로 즉시 학습을 할 수 있다.

점진적으로 학습이 일어나기 때문에 점진적 학습(Incremental learning)이라고도 하며, 온라인 학습은 오프라인으로도 시행되기도 하므로(외부 메모리 학습), 온라인 학습이라는 용어보다 점진적 학습이 정확한 명칭이라 할 수 있다.

온라인 학습은 연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하거나, 자원이 매우 한정된 환경에 적합하다.

온라인 학습 모델은 새로운 데이터 샘플을 학습하면, 학습이 끝난 데이터는 더 이상 필요하지 않기 떄문에 보관하지 않아도 되므로, 저장 공간을 많이 아낄 수 있다.

2.1. 외부 메모리 학습(Out-of-core learning)

빅 데이터 분석 시, 데이터의 양이 지나치게 커서, 컴퓨터의 메모리로 감당되지 않는 경우가 종종 있으며, 이때에도 온라인 학습 알고리즘이 사용된다.

데이터 일부를 읽어 들여 머신러닝 알고리즘이 학습하며, 전체 데이터가 모두 적용될 때까지 일부를 학습하는 과정을 반복한다.

온라인 학습 모델에서는 학습률(Learning Rate) 이 가장 중요한 하이퍼 파라미터로 작동하며, 이는 모델이 변화하는 데이터에 얼마나 빠르게 적응할지를 이야기한다.

이 가장 중요한 하이퍼 파라미터로 작동하며, 이는 모델이 변화하는 데이터에 얼마나 빠르게 적응할지를 이야기한다. 학습률이 높은 경우, 시스템이 데이터에 빠르게 적응하나, 과거의 데이터를 금방 잊는다.

학습률이 낮은 경우, 시스템의 관성이 커져 더 느리게 학습되지만, 노이즈나 대표성이 없는 데이터 포인트에 덜 민감해진다.

2.2. 온라인 학습의 문제점

나쁜 데이터가 주입되었을 때, 시스템의 성능이 점진적으로 감소하게 된다.

예를 들어, 실시간 추천 알고리즘에서 누군가가 자신이 만든 콘텐츠나 제품을 상위에 노출시키고자, 자신의 의도를 담은 데이터를 다량 생성할 수 있다. 이 경우, 모델은 이 데이터를 학습하여, 실제 알고리즘에서 노출시키고자 대상이 아닌, 누군가가 의도적으로 생성한 데이터를 노출시킬 수 있다.

때문에, 온라인 학습에서는 시스템을 지속적으로 모니터링하고, 성능 감소가 감지되면, 즉시 학습을 중지시키고, 성능 감소가 이루어지기 전 상태로 되돌려야 한다.

또는 이상 감지 머신러닝 알고리즘을 데이터 수집 앞에 넣어, 비정상 데이터가 온라인 학습 모델에 들어가지 않게 막을 수도 있다.

[참고 서적]

지금까지 배치 학습과 온라인 학습에 대해 알아보았다. 배치 학습은 일반적인 머신러닝 알고리즘 학습 방법이나, 수많은 환경(특히 빅데이터를 사용하는 환경)에서 배치 학습을 사용하지 못하는 경우가 많다. 이런 경우에는 온라인 학습 방법을 사용하지 않는다면, 제대로 된 학습을 하지 못할 수 있다.

728×90

반응형

[ML] 머신러닝 시스템의 종류 (2) – 배치 학습, 온라인 학습

배치 학습과 온라인 학습

배치 학습(Batch Learning)

배치 학습에서는 시스템이 점진적으로 학습할 수 없습니다. 가용한 데이터를 모두 사용해 훈련시켜야 합니다.

이러한 방식은 시간과 자원을 많이 소모하여 일반적으로 오프라인에서 가동됩니다.

먼저 시스템을 훈련시키고 제품 시스템에 적용하면 더 이상의 학습 없이 실행됩니다.

즉, 학습한 것을 적용할 뿐입니다. 이를 오프라인 학습(Offline Learning)이라고 합니다.

배치 학습 시스템이 새로운 데이터에 대해 학습하려면 전체 데이터를 사용하여 시스템의 새로운 버전을 처음부터 다시 훈련해야 합니다.

이후 이전 시스템을 중지시키고 새로운 시스템으로 교체합니다.

이러한 방식은 간단하고 잘 작동하지만 전체 데이터 셋을 사용해 훈련하는데 몇 시간이 소요될 수 있습니다.

또한, 전체 데이터 셋을 사용해 훈련하기 때문에 시스템 자원을 많이 소모합니다. 자원이 제한된 시스템이 스스로 학습해야 할 때 많은 양의 훈련 데이터를 나르고 학습을 위해 자원을 사용하는 경우 문제를 발생시킬 수 있습니다.

온라인 학습(Online Learning)

온라인 학습에서는 데이터를 순차적으로 한 개씩 또는 미니배치(Mini-Batch)라 부르는 작은 묶음 단위로 주입하여 시스템을 훈련시킵니다.

매 학습 단계가 빠르고 비용이 적게 들어 시스템은 데이터가 도착하는 대로 즉시 학습할 수 있습니다.

온라인 학습은 연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하는 시스템에 적합합니다.

컴퓨팅 자원이 제한된 경우에도 적합하다고 할 수 있습니다. 학습이 끝난 데이터는 더 이상 필요하지 않으므로 버리면 됩니다.

온라인 학습 시스템에서 중요한 파라미터 중 하나는 변화하는 데이터에 얼마나 빠르게 적응할 것인지 입니다.

이를 학습률(Learning Rate)이라고 합니다. 학습률을 높게 하면 시스템이 데이터에 빠르게 적응하지만 예전 데이터를 금방 잊어버리게 됩니다.

반대로 학습률이 낮으면 시스템의 관성이 더 커져서 더 느리게 학습됩니다. 하지만 새로운 데이터에 있는 잡음이나 대표성 없는 데이터 포인트에 덜 민감해집니다.

온라인 학습의 가장 큰 문제점은 시스템에 나쁜 데이터가 주입되었을 때 시스템 성능이 점진적으로 감소할 수 있다는 것입니다.

이러한 위험을 줄이기 위해서는 시스템을 면밀히 모니터링하고 성능 감소사 감지되면 즉각적으로 학습을 중지시키는 대처가 필요합니다.

Reference

오렐리앙 제롱, ‘핸즈온 머신러닝’, 한빛미디어, 2018

배치학습 vs 온라인학습

머신러닝 시스템을 분류하는 데 사용하는 다른 기준은 입력 데이터의 스트림 (stream) 으로부터 점진적으로 학습할 수 있는지의 여부

단점 : 전체 데이터 셋을 사용해 훈련하는 데 몇시간이 소요될 수 있다 . 또한 전체 데이터셋을 사용하기 때문에 엄청나고 많은 컴퓨터 자원이 필요할 수 있기 때문에 오히려 불편할 수 있다 . 이런경우 점진적으로 학습할 수 있는 알고리즘을 사용하는 편이 낫다 .

주기적으로 데이터셋을 사용해 훈련하는데 몇시간이 소요된다 .

배치 학습이 새로운 데이터에 대해 학습하려면 전체 데이터를 사용하여 시스템의 새로운 버젼을 처음부터 다시 훈련할 필요가 있다 .

일반적으로 이 방식은 시간과 자원을 많이 소모하므로 보통 오프라인에서 수행

즉 , 학습한 것을 단지 적용만 한다 .

강용한 데이터를 모두 사용해 훈련시켜야 한다 .

시스템이 점진적으로 학습할 수 없다 .

데이터를 순차적으로 한개씩 또는 미니배치 (mini-batch) 라 부르는 작은 묶음 단위로 주입하여 시스템을 훈련

매 학습 단계가 빠르고 비용이 적게 들어 시스템은 데이터가 도착하는 대로 즉시 학습할 수 있다 .

장점 : 연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하는 시스템에 적합 -> 컴퓨터 자원이 제한된 경우에 좋은 선택

온라인 학습에서 중요한 파라미터

-> 학습률 (learning rate) : 변화하는 데이터에 얼마나 빠르게 적응할 것인지가 중요하다 .

학습률을 높게하면 시스템이 데이터에 빠르게 적응하지만 예전 데이터를 금방 잊어버린다 .

앤드류 응의 머신러닝(17-5): 온라인 학습 알고리즘

온라인 강의 플랫폼 코세라의 창립자인 앤드류 응 (Andrew Ng) 교수는 인공지능 업계의 거장입니다. 그가 스탠퍼드 대학에서 머신 러닝 입문자에게 한 강의를 그대로 코세라 온라인 강의 (Coursera.org)에서 무료로 배울 수 있습니다. 이 강의는 머신러닝 입문자들의 필수코스입니다. 인공지능과 머신러닝을 혼자 공부하면서 자연스럽게 만나게 되는 강의입니다.

Large Scale Machine Learning

(대규모 머신러닝)

Advanced Topic (고급 주제)

Online Learning (온라인 학습)

In this video, I’d like to talk about a new large-scale machine learning setting called the online learning setting. The online learning setting allows us to model problems where we have a continuous flood or a continuous stream of data coming in and we would like an algorithm to learn from that. Today, many of the largest websites, or many of the largest website companies use different versions of online learning algorithms to learn from the flood of users that keep on coming to, back to the website. Specifically, if you have a continuous stream of data generated by a continuous stream of users coming to your website, what you can do is sometimes use an online learning algorithm to learn user preferences from the stream of data and use that to optimize some of the decisions on your website.

이번 강의에서는 온라인 학습 알고리즘이라 불리는 새로운 대규모 머신 러닝 알고리즘에 대해 설명합니다. 온라인 학습 알고리즘은 실시간으로 유입되는 데이터를 모델링하고 학습합니다. 오늘날 많은 대규모 웹사이트에서 사용하는 여러 버전의 온라인 학습 알고리즘은 웹사이트를 방문하는 수많은 사용자들로부터 실시간으로 학습합니다. 대부분의 웹사이트는 연속적이고 지속적으로 방문하는 사용자들이 데이터를 실시간으로 생성하면서 데이터 스트림이 발생합니다. 온라인 학습 알고리즘은 데이터 스트림에서 사용자 선호도를 학습하고 최적화합니다.

Suppose you run a shipping service, so, you know, users come and ask you to help ship their package from location A to location B and suppose you run a website, where users repeatedly come and they tell you where they want to send the package from, and where they want to send it to (so the origin and destination) and your website offers to ship the package for some asking price, so I’ll ship your package for $50, I’ll ship it for $20. And based on the price that you offer to the users, the users sometimes chose to use a shipping service; that’s a positive example and sometimes they go away and they do not choose to purchase your shipping service. So let’s say that we want a learning algorithm to help us to optimize what is the asking price that we want to offer to our users.

여러분들은 배달 서비스 회사를 운영한다고 가정합니다. 사용자는 웹 사이트에 접속하여 물건을 A 장소에서 B 장소로 배달을 요청합니다. 사용자들이 반복적으로 접속하여 물건을 발송할 위치와 수신할 위치를 입력합니다. 웹 사이트는 출발지와 도착지 정보를 바탕으로 적정한 가격을 제안합니다. 배달 가격을 50달러 또는 20 달러로 제안할 것입니다. 사용자가 제안 가격을 보고 배달 서비스를 구매한다면 y =1 Positive 예제가 됩니다. 또는 배달 서비스를 구매하지 않는다면, y=0 Negative 예제입니다. 따라서, 학습 알고리즘이 사용자에게 최적화된 배달 가격을 제공하려고 한다고 가정합니다.

And specifically, let’s say we come up with some sort of features that capture properties of the users. If we know anything about the demographics, they capture, you know, the origin and destination of the package, where they want to ship the package. And what is the price that we offer to them for shipping the package. and what we want to do is learn what is the probability that they will elect to ship the package, using our shipping service given these features, and again just as a reminder these features X also captures the price that we’re asking for. And so if we could estimate the chance that they’ll agree to use our service for any given price, then we can try to pick a price so that they have a pretty high probability of choosing our website while simultaneously hopefully offering us a

fair return, offering us a fair profit for shipping their package. So if we can learn this property of y equals 1 given any price and given the other features we could really use this to choose appropriate prices as new users come to us. So in order to model the probability of y equals 1, what we can do is use logistic regression or neural network or some other algorithm like that. But let’s start with logistic regression.

구체적으로 사용자의 속성을 파악하는 피처를 생각해봅시다. 주요 피처는 지역별 인구, 배달할 물건의 출발지와 도착지 등입니다. 웹사이트는 주요 피처를 바탕으로 배달을 요청하는 사용자에게 배달 가격을 제시할 수 있습니다. 그리고 사용자들이 제시된 가격에 배달 서비스를 사용할 가능성을 추정할 수 있다면, 사용자들은 여러분의 웹사이트를 선택할 가능성이 높고 배달 서비스에 정당한 이윤을 얻을 수 있습니다. 만약 y = 1 Positive 예제에 해당하는 가격을 추정할 수 있다면, 여러분의 웹사이트에 접속한 신규 사용자에게 적절한 가격을 제시할 수 있습니다. 그래서, y의 확률을 모델링하기 위해 로지스틱 회귀 또는 인공 신경망 알고리즘을 사용합니다. 여기에서는 로지스틱 회귀 분석을 사용합니다.

Now if you have a website that just runs continuously, here’s what an online learning algorithm would do. I’m gonna write repeat forever. This just means that our website is going to, you know, keep on staying up. What happens on the website is occasionally a user will come and for the user that comes we’ll get some x, y pair corresponding to a customer or to a user on the website. So the features x are, you know, the origin and destination specified by this user and the price that we happened to offer to them this time around, and y is either one or zero depending one whether or not they chose to use our shipping service. Now once we get this {x, y} pair, what an online learning algorithm does is then update the parameters theta using just this example x, y, and in particular we would update my parameters theta as Theta j get updated as Theta j minus the learning rate alpha times my usual gradient descent rule for logistic regression. So we do this for j equals zero up to n, and that’s my close curly brace.

여기 사용자들이 지속적으로 접속하는 웹 사이트가 있습니다. 온라인 학습 알고리즘은 영원히 다음과 같은 일을 반복할 것입니다.

Repeat Forever {

Get (x, y) % 접속한 사용자에 대한 피처 x와 실제값 y의 획득

Update θ using (x, y) ;

θj := θj – α * (hθ(x) – y)*xj (for j = 0,1,…, n)

}

여기서, 피처 x는 사용자가 지정한 출발지, 목적지, 그리고 웹사이트가 제시하는 가격입니다. y는 사용자가 배달 서비스를 사용하기로 선택했는지 여부입니다. 선택했다면 y =1이고, 선택하지 않았다면 y = 0입니다. 그리고 온라인 학습 알고리즘은 접속한 사용자에 대해 (x, y)의 쌍을 바탕으로 파라미터 θ의 값을 업데이트합니다. 로지스틱 회귀 분석에서 사용하는 경사 하강 업데이트 규칙을 사용합니다.

So, for other learning algorithms instead of writing X-Y, right, I was writing things like Xi, Yi but in this online learning setting where actually discarding the notion of there being a fixed training set instead we have an algorithm. Now what happens as we get an example and then we learn using that example like so and then we throw that example away. We discard that example and we never use it again and so that’s why we just look at one example at a time. We learn from that example. We discard it. Which is why, you know, we’re also doing away with this notion of there being this sort of fixed training set indexed by i. And, if you really run a major website where you really have a continuous stream of users coming, then this sort of online learning algorithm is actually a pretty reasonable algorithm. Because of data is essentially free if you have so much data, that data is essentially unlimited then there is really may be no need to look at a training example more than once. Of course if we had only a small number of users then rather than using an online learning algorithm like this, you might be better off saving away all your data in a fixed training set and then running some algorithm over that training set. But if you really have a continuous stream of data, then an online learning algorithm can be very effective.

확률적 경사 하강 알고리즘을 제외한 다른 알고리즘들은 루프에 (x, y) 대신에 (x^(i), y^(i))을 사용합니다. 온라인 학습 알고리즘은 고정된 학습 셋이라는 개념이 없습니다. 대신에 알고리즘은 지속적으로 유입되는 사용자로부터 학습 예제 하나를 획득합니다. 획득된 학습 예제를 학습한 후 폐기합니다. 한 번 사용했던 예제를 다시 사용하지 않습니다. 그것이 온라인 학습 알고리즘이 한 번에 하나의 예제만을 사용하고 고정된 학습 셋 (x^(i), y^(i))를 사용하지 않는 이유입니다. 온라인 학습 알고리즘은 획득한 모범 사례를 학습하고 폐기합니다. 사용자들이 지속적으로 유입되는 웹사이트는 충분히 새로운 데이터를 확보할 수 있기 때문에 과거의 데이터를 두 번 활용할 필요가 없습니다. 데이터는 충분하고 거의 무제한에 가깝기 때문입니다. 반대로 사용자가 지속적으로 유입되지만 데이터가 충분하지 않다면, 모든 데이터를 고정된 학습 셋에 저장한 다음 알고리즘을 실행하는 것이 좋습니다. 온라인 학습 알고리즘은 연속적인 데이터 스트림이 발생하는 환경에서 매우 효과적입니다.

I should mention also that one interesting effect of this sort of online learning algorithm is that it can adapt to changing user preferences. And in particular, if over time because of changes in the economy maybe users start to become more price sensitive and willing to pay, you know, less willing to pay high prices. Or if they become less price sensitive and they’re willing to pay higher prices. Or if different things become more important to users, if you start to have new types of users coming to your website. This sort of online learning algorithm can also adapt to changing user preferences and kind of keep track of what your changing population of users may be willing to pay for. And it does that because if your pool of users changes, then these updates to your parameters theta will just slowly adapt your parameters to whatever your latest pool of users looks like.

온라인 학습 알고리즘은 사용자 선호도의 변화에 적응할 수 있다는 것입니다. 경제 상황이 변함에 따라 가격 설정을 변경할 수 있습니다. 예를 들면, 사용자들이 가격에 민감해지는 시기에는 낮은 가격을 제시하고, 사용자들이 가격에 둔감해지는 시기에는 높은 가격을 제시합니다. 또한, 새로운 유형의 사용자들이 지속적으로 증가한다거나 사용자들의 관심사가 바뀌었을 때 온라인 학습 알고리즘은 사용자 선호도에 맞추어 적응할 수 있습니다. 기꺼이 지불할 의향이 있는 사용자들을 추적하고 관리할 수 있습니다. 온라인 학습 알고리즘은 사용자 선호도의 변화에 따라 자동적으로 파라미터 θ를 천천히 조정할 수 있기 때문입니다.

Here’s another example of a sort of application to which you might apply online learning. this is an application in product search in which we want to apply learning algorithm to learn to give good search listings to a user. Let’s say you run an online store that sells phones – that sells mobile phones or sells cell phones. And you have a user interface where a user can come to your website and type in the query like “Android phone 1080p camera”. So 1080p is a type of a specification for a video camera that you might have on a phone, a cell phone, a mobile phone. Suppose, suppose we have a hundred phones in our store. And because of the way our website is laid out, when a user types in a query, if it was a search query, we would like to find a choice of ten different phones to show what to offer to the user. What we’d like to do is have a learning algorithm help us figure out what are the ten phones out of the 100 we should return the user in response to a user-search query like the one here.

여기 온라인 학습 알고리즘의 또 다른 응용 사례가 있습니다. 온라인 학습 알고리즘이 사용자들에게 검색 결과를 제공하는 방법을 학습합니다. 여러분들이 스마트폰을 판매하는 상점을 운영한다고 가정합니다. 사용자들이 웹사이트에 방문하여 “안드로이드 폰 1080p 카메라”와 같은 검색어를 입력할 수 있는 검색창이 있습니다. 여기 1080p는 스마트폰에서 사용하는 카메라의 사양입니다. 현재 여러분의 상점에 100대의 전화기가 있습니다. 웹사이트의 검색 결과의 배치 방식과 검색 키워드에 따라 검색 결과를 10 가지 다른 스마트폰을 표시합니다. 학습 알고리즘은 100 대중에서 10대의 전화기를 사용자에게 표시합니다.

Here’s how we can go about the problem. For each phone and given a specific user query; we can construct a feature vector X. So the feature vector X might capture different properties of the phone. It might capture things like, how similar the user search query is in the phones. We capture things like how many words in the user search query match the name of the phone, how many words in the user search query match the description of the phone and so on. So the features x capture properties of the phone and it captures things about how similar or how well the phone matches the user query along different dimensions. What we like to do is estimate the probability that a user will click on the link for a specific phone, because we want to show the user phones that they are likely to want to buy, want to show the user phones that they have high probability of clicking on in the web browser. So I’m going to define y equals one if the user clicks on the link for a phone and y equals zero otherwise and what I would like to do is learn the probability the user will click on a specific phone given, you know, the features x, which capture properties of the phone and how well the query matches the phone. To give this problem a name in the language of people that run websites like this, the problem of learning this is actually called the problem of learning the predicted click-through rate, the predicted CTR. It just means learning the probability that the user will click on the specific link that you offer them, so CTR is an abbreviation for click through rate.

검색 결과로 10대의 스마트폰을 표시하는 문제입니다. 사용자 검색 키워드와 스마트폰의 속성과 비교합니다. 피처 벡터 x는 스마트폰의 속성을 정의하고, 알고리즘은 사용자 검색 키워드가 스마트폰의 속성과 얼마나 유사한 지를 파악합니다. 주요 피처 x는 사용자 검색 키워드가 스마트폰의 이름과 일치하는지, 스마트 폰 설명과 몇 개나 일치하는지 등을 파악합니다. 스마트폰의 속성을 나타내는 피처 x와 사용자 검색 키워드가 얼마나 유사한 지를 파악합니다. 그리고, 사용자가 표시한 검색 결과에서 특정 스마트폰에 대한 URL 링크를 클릭할 확률을 추정하는 것입니다. 왜냐하면 웹사이트는 사용자가 구매할 가능성이 높은 스마트폰을 보여주고 싶기 때문입니다. 웹 브라우저에서 사용자가 스마트폰의 링크를 클릭하면 y=1이고, 그렇지 않으면 y=0입니다. 알고리즘은 사용자가 특정 스마트폰의 링크를 클릭할 때 확률을 학습합니다. 피처 x는 스마트폰의 속성과 사용자의 검색 키워드가 얼마나 일치하는 지를 파악하고, 클릭할 확률에 따라 검색 결과를 표시합니다. 이와 같은 웹사이트를 운영하는 사람들은 이런 유형의 학습 문제를 실제 예측 클릭률 (CTR, click-through rate)라고 합니다. 예측 CTR은 알고리즘이 사용자가 웹사이트가 제공하는 특정 링크를 클릭할 확률을 학습하는 것을 의미합니다.

And if you can estimate the predicted click-through rate for any particular phone, what we can do is use this to show the user the ten phones that are most likely to click on, because out of the hundred phones, we can compute this for each of the 100 phones and just select the 10 phones that the user is most likely to click on, and this will be a pretty reasonable way to decide what ten results to show to the user. Just to be clear, suppose that every time a user does a search, we return ten results what that will do is it will actually give us ten x, y pairs, this actually gives us ten training examples every time a user comes to our website because, because for the ten phone that we chose to show the user, for each of those 10 phones we get a feature vector X, and for each of those 10 phones we show the user we will also get a value for y, we will also observe the value of y, depending on whether or not we clicked on that url or not and so, one way to run a website like this would be to continuously show the user, you know, your ten best guesses for what other phones they might like and so, each time a user comes you would get ten examples, ten x, y pairs, and then use an online learning algorithm to update the parameters using essentially 10 steps of gradient descent on these 10 examples, and then you can throw the data away, and if you really have a continuous stream of users coming to your website, this would be a pretty reasonable way to learn parameters for your algorithm so as to show the ten phones to your users that may be most promising and the most likely to click on. So, this is a product search problem or learning to rank phones, learning to search for phones example.

특정 스마트폰에 대한 예상 클릭률을 추정할 수 있다면, 웹사이트는 사용자가 클릭할 가능성이 가장 높은 스마트폰 10대를 표시할 수 있습니다. 100대의 스마트폰에 대해 p( y=1 |x; θ)를 계산할 수 있기 때문입니다. 100 개의 스마트폰에 대해 사용자가 클릭할 확률을 계산하고, 가장 높은 확률을 가진 10 개의 스마트폰을 표시하는 것은 매우 합리적인 방법입니다. 명확히 말하면, 사용자가 검색할 때마다 10개의 결과를 반환한다는 것은 10 개의 (x, y) 쌍을 제공하는 것입니다. 각각의 스마트폰은 피처 벡터 x를 가지고 있습니다. 사용자가 특정 링크를 클릭했는 지의 여부에 따라 y의 값을 추적합니다. 웹사이트는 사용자가 검색을 요청할 때마다 10대의 다른 스마트폰을 표시합니다. 새로운 사용자가 검색할 때마다 학습 예제 (x, y) 쌍을 얻은 다음 온라인 학습 알고리즘은 10 개의 스마트폰을 표시하고 10번의 경사 하강법을 사용하여 파라미터를 업데이트합니다. 데이터를 제거하고 웹에 지속적으로 유입되는 사용자에게 가장 잘 팔릴 확률이 높은 10대의 스마트폰을 표시하기 위한 파라미터를 학습하는 매우 합리적인 방법입니다. 이것이 제품 검색 문제이기도 하고, 스마트폰들의 순위를 학습하는 것이고 하고, 스마트폰 검색하는 방법을 학습하는 것이기도 합니다.

So, I’ll quickly mention a few others. One is, if you have a website and you’re trying to decide, you know, what special offer to show the user, this is very similar to phones, or if you have a website and you show different users different news articles. So, if you’re a news aggregator website, then you can again use a similar system to select, to show to the user, you know, what are the news articles that they are most likely to be interested in and what are the news articles that they are most likely to click on. Closely related to special offers, will we profit from recommendations.

몇 가지 다른 예제도 살펴보겠습니다. 웹사이트에서 사용자에게 어떤 특별한 제안을 표시할지를 결정할 때, 스마트폰과 매우 유사한 웹사이트에서 개인화된 글을 표시할 때 또는 개인화된 제품을 추천할 때 온라인 학습 알고리즘을 사용합니다. 뉴스를 모아놓은 웹사이트는 유사한 방식으로 사용하여 사용자가 가장 관심을 가질만한 뉴스 기사를 표시할 수 있습니다. 클릭할 가능성이 가장 높은 기사나 특별 제안이나 제품 추천을 하고, 웹사이트는 이익을 얻습니다.

And in fact, if you have a collaborative filtering system, you can even imagine a collaborative filtering system giving you additional features to feed into a logistic regression classifier to try to predict the click through rate for different products that you might recommend to a user. Of course, I should say that any of these problems could also have been formulated as a standard machine learning problem, where you have a fixed training set. Maybe, you can run your website for a few days and then save away a training set, a fixed training set, and run a learning algorithm on that. But these are the actual sorts of problems, where you do see large companies get so much data, that there’s really maybe no need to save away a fixed training set, but instead you can use an online learning algorithm to just learn continuously from the data that users are generating on your website.

실제로 협업 필터링 시스템이 있는 경우 사용자에게 추천할 수 있는 다양한 제품의 클릭률을 예측하기 위해 로지스틱 회귀 분류기에 추가 피처를 제공하는 협업 필터링 시스템을 상상할 수 있습니다. 물론, 고정된 학습 셋이 있는 표준 머신 러닝 문제일 수 있습니다. 아마도 며칠 동안 웹사이트를 운영한 다음 고정된 학습 셋을 저장하고 적절한 알고리즘이 데이터 셋을 학습하게 할 수 있습니다. 그러나 이것은 활용의 문제입니다. 대기업이 너무 많은 데이터를 얻고 고정된 학습 셋을 저장할 필요가 없을 수도 있지만 온라인 학습 알고리즘이 웹사이트에서 지속적으로 생성되는 데이터를 연속적으로 학습할 수도 있습니다.

So, that was the online learning setting and as we saw, the algorithm that we apply to it is really very similar to this schotastic gradient descent algorithm, only instead of scanning through a fixed training set, we’re instead getting one example from a user, learning from that example, then discarding it and moving on. And if you have a continuous stream of data for some application, this sort of algorithm may be well worth considering for your application. And of course, one advantage of online learning is also that if you have a changing pool of users, or if the things you’re trying to predict are slowly changing like your user taste is slowly changing, the online learning algorithm can slowly adapt your learned hypothesis to whatever the latest sets of user behaviors are like as well.

지금까지 온라인 학습 알고리즘이었습니다. 온라인 학습 알고리즘은 확률적 경사 하강법 알고리즘과 매우 유사합니다. 고정된 훈련 셋을 통해 학습하는 대신에 하나의 예제를 사용합니다. 알고리즘은 접속한 한 명의 사용자에 대해 피처를 학습한 다음 데이터를 폐기합니다. 꾸준히 접속하는 사용자가 있는 웹사이트와 경우 이런 종류의 온라인 학습 알고리즘을 충분히 고려할 가치가 있습니다. 온라인 학습 알고리즘의 한 가지 장점은 사용자 구성원이 계속 변하거나 사용자의 취향이 변하거나 사용자 행동이 변하는 것에 맞추어 적응할 수 있다는 것입니다.

앤드류 응의 머신러닝 동영상 강의

정리하며

온라인 학습 알고리즘은 실시간으로 유입되는 데이터를 모델링하고 학습합니다. 온라인 학습 알고리즘은 웹사이트를 방문하는 수많은 사용자들은 연속적이고 지속적으로 데이터를 생성하면서 데이터 스트림이 발생합니다.

대형 웹사이트는 충분하고 거의 무제한에 가까운 새로운 데이터를 확보할 수 있기 때문에 과거의 데이터를 두 번 활용할 필요가 없습니다. 반대로 사용자가 지속적으로 유입되지만 데이터가 충분하지 않다면, 모든 데이터를 고정된 학습 셋에 저장한 다음 알고리즘을 실행하는 것이 좋습니다. 온라인 학습 알고리즘은 연속적인 데이터 스트림이 발생하는 환경에서 매우 효과적입니다.

온라인 학습 알고리즘은 사용자 선호도의 변화에 적응할 수 있다는 것입니다. 새로운 유형의 사용자들이 지속적으로 증가한다거나 사용자들의 관심사가 바뀌었을 때 온라인 학습 알고리즘은 사용자 선호도에 맞추어 적응할 수 있습니다. 온라인 학습 알고리즘은 사용자 선호도의 변화에 따라 자동적으로 파라미터 θ를 천천히 조정할 수 있기 때문입니다.

온라인 학습 알고리즘은 사용자의 속성을 나타내는 피처 x와 사용자 검색 키워드가 얼마나 유사한 지를 파악합니다. 그리고, 사용자가 표시한 검색 결과에서 특정 스마트폰에 대한 URL 링크를 클릭할 확률을 추정하는 것입니다. 웹 브라우저에서 사용자가 스마트폰의 링크를 클릭하면 y=1이고, 그렇지 않으면 y=0입니다. 알고리즘은 사용자가 특정 스마트폰의 링크를 클릭할 때 확률을 학습합니다. 이런 유형의 학습 문제를 실제 예측 클릭률 (CTR, click-through rate)라고 합니다.

온라인 학습 알고리즘은 확률적 경사 하강법 알고리즘과 매우 유사합니다. 고정된 훈련 셋을 통해 학습하는 대신에 하나의 예제를 사용합니다. 알고리즘은 접속한 한 명의 사용자에 대해 피처를 학습한 다음 데이터를 폐기합니다.

문제 풀이

온라인 학습 알고리즘을 사용하는 장점은 무엇입니까?

정답은 1번과 3번입니다.

오늘 할 일: 끝내주게 숨쉬기 오늘 할 일: 끝내주게 숨쉬기

머신러닝은 입력 데이터의 스트림(stream)으로부터 점진적으로 학습할 수 있는지에 따라 배치학습 또는 온라인학습으로 분류될 수 있습니다. 아래에서 각각에 대해 알아보겠습니다.

1. 배치 학습(Batch Learning) = 오프라인 학습

시스템이 점진적으로 학습할 수 없는 학습입니다.

이용 가능한 데이터를 학습할 시점에 모두 사용하여 훈련 시켜야 합니다.

시켜야 합니다. 시간과 자원을 많이 소모하므로 보통 오프라인에서 수행됩니다.

모델을 훈련시키고 적용하면 더 이상의 학습없이 실행됩니다.

새로운 데이터에 대해 학습하려면 새로운 데이터뿐만 아니라 이전 데이터도 모두 포함한 전체 데이터를 사용해 처음부터 다시 학습시켜야 합니다.

새로운 데이터뿐만 아니라 이전 데이터도 모두 포함한 합니다. 데이터를 업데이트하고 시스템의 새 버전을 서비스 운영에 필요한 만큼 자주 훈련시키면 됩니다.

다만 데이터가 빠르게 변화하여 모델이 이에 신속하게 대응해야 하는 경우에는 적절하지 않습니다.

2. 온라인 학습(Online Learning)

데이터 양이 너무 많아 배치 학습 알고리즘을 사용하기 어려운 경우에 적용합니다.

데이터를 순차적으로 한 개씩 혹은 미니배치(mini-batch)라 부르는 작은 묶음 단위로 주입해 시스템을 훈련 시킵니다.

시킵니다. 매 학습 단계가 빠르고 비용이 적게 들어 시스템은 데이터가 도착하는 대로 즉시 학습할 수 있씁니다.

연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하는 시스템에 적합합니다.

컴퓨터 자원이 제한된 경우 적절한 선택이 될 수 있습니다.

온라인 학습에서 중요한 파라미터는 학습률(learning rate) 로, 변화하는 데이터에 얼마나 빠르게 적응할 것인지를 의미합니다. 학습률을 높게하면, 시스템이 최신 데이터에 빠르게 적응하지만 과거 데이터를 금방 잊습니다. 학습률을 낮게하면, 시스템의 관성이 커져 느리게 학습됩니다. 하지만 최신 데이터에 존재하는 잡음이나 대표성 없는 데이터에 덜 민감합니다.

로, 변화하는 데이터에 얼마나 빠르게 적응할 것인지를 의미합니다.

출처

https://tensorflow.blog/%ED%95%B8%EC%A6%88%EC%98%A8-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-1%EC%9E%A5-2%EC%9E%A5/1-3-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EC%8B%9C%EC%8A%A4%ED%85%9C%EC%9D%98-%EC%A2%85%EB%A5%98/

[논문]온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구

안내

> 총 건의 자료가 검색되었습니다. > 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) > 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. > 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) > 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오 > ~ > Text(ASCII format)

Excel format

[핸즈온 머신러닝 정리] 1장. 배치 학습과 온라인 학습

앞 포스팅에서 머신러닝을 지도 학습, 비지도 학습, 강화 학습으로 나누어 보았다. 이는 ‘학습하는 동안의 감독 형태나 정보량’을 기준으로 분류한 것이다.

한편, 머신러닝은 ‘입력 데이터의 스트림(stream)으로부터 점진적으로 학습할 수 있는가?’에 따라 학습 방법을 크게 3가지로 나뉜다.

배치 학습( Batch Learning )

) 온라인 학습( Online Learning )

배치 학습

배치 학습에서는 시스템이 점진적으로 학습할 수 없으며, 가용한 데이터를 모두 사용해 훈련시켜야 한다. 먼저 시스템을 훈련시키고 그런 다음 제품 시스템에 적용하면 더 이상의 학습 없이 실행되게 때문에 학습한 것을 단지 적용만 하게 된다. 일반적으로 이 방식은 시간과 자원을 많이 소모하므로 보통 오프라인에서 수행한다. 그래서 ‘오프라인 학습(Offline learning)’이라고 부르기도 한다.

배치 학습 시스템이 새로운 데이터에 대해 학습하기 위해서는 새로운 데이터와 이전 데이터를 모두 포함한 전체 데이터를 사용하여 시스템의 새로운 버전을 처음부터 다시 훈련해야 된다. 그 후 이전 시스템을 중지시키고 새 시스템으로 교체한다.

머신러닝의 경우 시스템을 훈련, 평가, 론칭하는 전체 과정이 쉽게 자동화될 수 있기 때문에 이러한 배치 학습 시스템에도 적응이 가능하다. 데이터를 업데이트하고 시스템의 새 버전을 필요한 만큼 자주 훈련시켜야 할 것이다.

그러나 주기적으로 전체 데이터셋을 사용해 훈련을 시켜줘야 하며, 훈련하는 데 몇 시간이 소요될 지 모른다. 또한 대량의 데이터는 큰 비용을 발생시킬 수 있으며 아주 많은 데이터 양은 배치 학습 알고리즘 사용을 불가능하게 만들 수 있다.

이런 경우 점진적으로 학습할 수 있는 알고리즘을 사용하는 것이 옳다.

온라인 학습

온라인 학습은 데이터를 순차적으로 한 개씩 또는 미니배치라 부르는 작은 묶음 단위로 주입하여 시스템을 훈련시킨다. 매 학습 단계가 빠르고 비용이 적게 들기 때문에 시스템은 데이터가 도착하는 대로 즉시 학습할 수 있다.

론칭은 훈련된 알고리즘을 공개적으로 오픈한다는 의미이다.

온라인 학습은 배치 학습과는 달리, 연속적으로 데이터를 받고 빠른 변화에 스스로 적응해야 하는 시스템에 적합하다. 온라인 학습 시스템이 새로운 데이터 샘플을 학습하면 학습이 끝난 데이터는 더는 필요하지 않으므로 버려도 무관하다. 이는 많은 공간의 절약으로 이어진다.

컴퓨터 한 대의 메인 메모리에 들어갈 수 없는 아주 큰 데이터셋을 학습하는 시스템에도 온라인 학습 알고리즘을 사용할 수 있다. 이를 외부 메모리 학습이라고 한다. 알고리즘이 데이터 일부를 읽어 들이고 훈련 단계를 수행하는데, 전체 데이터가 모두 적용될 때까지 이 과정을 반복한다.

*주의해야할 점은 외부 메모리 학습은 오프라인에서 진행된다는 것이다. 온라인 학습이라고 해서 무조건적으로 온라인에서 진행되는 것은 아니다. 온라인 학습을 점진적 학습으로 생각하는 것이 이해하기 좋을 것이다.

학습률

온라인 학습 시스템에서 중요한 파라미터중 하나는 학습률이다. 학습률이란 변화하는 데이터에 얼마나 빠르게 적응할 것인가를 나타낸 것이다. 학습률을 높게 하면 시스템이 데이터에 빠르게 적응하지만, 예전 데이터를 금방 잊어버릴 것이다. 반대로 학습률을 낮게 하면 상대적으로 더 느리게 학습된다. 하지만 새로운 데이터에 있는 잡음이나 대표성 없는 데이터 포인트에 덜 민감해진다.

온라인 학습의 문제점

온라읜 학습의 가장 큰 문제점은 시스템에 나쁜 데이터가 주입되었을 떄 시스템 성능이 점진적으로 감소한다는 것이다. 이러한 위험을 줄이기 위해서는 시스템을 면밀히 모니터링하고 성능 감소가 감지되면 즉각적으로 학습을 중지시켜야 할 것이다. 입력 데이터를 모니터링해서 비정상 데이터를 잡아내는 것도 하나의 해결책이 될 수 있다.

머신러닝 시스템 종류(batch vs online learning/ model vs instance learning)

1.3.2 배치 학습과 온라인 학습

머신러닝 시스템을 분류하는 데 사용하는 다른 기준은 입력 데이터의 스트림stream 으로부터 점진적으로 학습할 수 있는지 여부입니다.

배치 학습

배치 학습batch learning에서는 시스템이 점진적으로 학습할 수 없습니다. 가용한 데이터를 모두 사용해 훈련시켜야 합니다. 일반적으로 이 방식은 시간과 자원을 많이 소모하므로 보통 오프라인에서 수행됩니다. 먼저 시스템을 훈련시키고 그런 다음 제품 시스템에 적용하면 더 이상의 학습없이 실행됩니다. 즉, 학습한 것을 단지 적용만 합니다. 이를 오프라인 학습offline learning이라고 합니다.

배치 학습 시스템이 (새로운 종류의 스팸 같은) 새로운 데이터에 대해 학습하려면 (새로운 데이터뿐만 아니라 이전 데이터도 포함한) 전체 데이터를 사용하여 시스템의 새로운 버전을 처음부터 다시 훈련해야 합니다. 그런 다음 이전 시스템을 중지시키고 새 시스템으로 교체합니다.

다행히 ([그림 1-3]에 보았듯이) 머신러닝 시스템을 훈련, 평가, 론칭하는 전체 과정이 쉽게 자동화될 수 있어서 배치 학습 시스템도 변화에 적응할 수 있습니다. 데이터를 업데이트하고 시스템의 새 버전을 필요한 만큼 자주 훈련시키면 됩니다.

이런 방식이 간단하고 잘 작동하지만 전체 데이터셋을 사용해 훈련하는 데 몇 시간이 소요될 수 있습니다. 보통 24시간마다 또는 매주 시스템을 훈련시킵니다. 시스템이 빠르게 변하는 데이터에 적응해야 한다면(예를 들면 주식가격) 더 능동적인 방법이 필요합니다.

또한 전체 데이터셋을 사용해 훈련한다면 많은 컴퓨팅 자원이 필요합니다(CPU , 메모리 공간, 디스크 공간, 디스크 IO , 네트워크 IO 등). 대량의 데이터를 가지고 있는데 매일 처음부터 새로 훈련시키도록 시스템을 자동화한다면 큰 비용이 발생할 것입니다. 데이터 양이 아주 많으면 배치 학습 알고리즘을 사용하는 게 불가능할 수도 있습니다.

마지막으로, 자원이 제한된 시스템(예를 들면 스마트폰 또는 화성 탐사 로버rover )이 스스로 학습해야 할 때 많은 양의 훈련 데이터를 나르고 학습을 위해 매일 몇 시간씩 많은 자원을 사용하면 심각한 문제를 일으킵니다.

이런 경우에는 점진적으로 학습할 수 있는 알고리즘을 사용하는 편이 낫습니다.

온라인 학습

온라인 학습online learning 에서는 데이터를 순차적으로 한 개씩 또는 미니배치mini-batch 라 부르는 작은 묶음 단위로 주입하여 시스템을 훈련시킵니다. 매 학습 단계가 빠르고 비용이 적게 들어 시스템은 데이터가 도착하는 대로 즉시 학습할 수 있습니다(그림 1 -13).

온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구

타입을 선택하세요 :

타입을 선택하세요 : BibTex RIS APA Harvard MLA Vancouver Chicago ACS AMA NLM IEEE

@article{ART002689843,

author={신원섭 and 신동훈},

title={온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구},

journal={초등과학교육},

issn={1598-3099},

year={2021},

volume={40},

number={1},

pages={66-80}

}

TY – JOUR

AU – 신원섭

AU – 신동훈

TI – 온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구

T2 – 초등과학교육

JO – 초등과학교육

PY – 2021

VL – 40

IS – 1

PB – 한국초등과학교육학회

SP – 66

EP – 80

SN – 1598-3099

AB – This study is a case study that applies plant classification learning using machine learning to fourth graders in elementary school in online learning situations. In this study, a plant classification learning education program associated with 2015 revision science curriculum was developed by applying the Artificial Intelligence biological classification teaching Learning model. The study participants were 31 fourth graders who agreed to participate voluntarily. Plant classification learning using machine learning was applied six hours for three weeks. The results of this study are as follows. First, as a result of image analysis on artificial intelligence, participants were mainly aware of artificial intelligence as mechanical (27%), human (23%) and household goods (23%). Second, an artificial intelligence recognition survey by semantic discrimination found that artificial intelligence was recognized as smart, good, accurate, new, interesting, necessary, and diverse. Third, there was a difference between men and women in perception and emotion of artificial intelligence, and there was no difference in perception of the ability of artificial intelligence. Fourth, plant classification learning using machine learning in this study influenced changes in artificial intelligence perception. Fifth, plant classification learning using machine learning in this study had a positive effect on reasoning ability.

KW – online learning, machine learning, plant classification learning, artificial intelligence biological classification, 4th grade elementary school

DO –

UR –

ER –

신원섭 and 신동훈. (2021). 온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구. 초등과학교육, 40(1), 66-80.

신원섭 and 신동훈. 2021, “온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구”, 초등과학교육, vol.40, no.1 pp.66-80.

신원섭, 신동훈 “온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구” 초등과학교육 40.1 pp.66-80 (2021) : 66.

신원섭, 신동훈. 온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구. 2021; 40(1), 66-80.

신원섭 and 신동훈. “온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구” 초등과학교육 40, no.1 (2021) : 66-80.

신원섭; 신동훈. 온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구. 초등과학교육, 40(1), 66-80.

신원섭; 신동훈. 온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구. 초등과학교육. 2021; 40(1) 66-80.

신원섭, 신동훈. 온라인 학습에서 머신러닝을 활용한 초등 4학년 식물 분류 학습의 적용 사례 연구. 2021; 40(1), 66-80.

키워드에 대한 정보 온라인 학습 머신 러닝

다음은 Bing에서 온라인 학습 머신 러닝 주제에 대한 검색 결과입니다. 필요한 경우 더 읽을 수 있습니다.

See also  속편 한 내과 뉴저지 | 내시경 검사 어디서 할까? 믿을만한 내시경 병원 찾는 법 #내시경 검사 #위내시경 #대장내시경 11 개의 가장 정확한 답변
See also  엘지 세탁 건조기 | 22년형 Lg 트롬 세탁기\U0026 건조기는 어떤 점이 달라졌을까? ㅣ오군렌탈샵 12560 투표 이 답변

See also  고령화 가족 다시보기 | 삼촌한테 욕부터 박는 이상한 조카 3152 투표 이 답변

이 기사는 인터넷의 다양한 출처에서 편집되었습니다. 이 기사가 유용했기를 바랍니다. 이 기사가 유용하다고 생각되면 공유하십시오. 매우 감사합니다!

사람들이 주제에 대해 자주 검색하는 키워드 머신러닝 온라인 교육 1편 – 머신러닝의 기초 개념을 잡아봅시다

  • 머신러닝
  • 다빈치랩스
  • 아일리스
  • machine learning
  • artificial intelligence
  • davincilabs
  • ailys
  • 머신러닝교육
  • automl
  • 데이터분석
  • 데이터분석교육
  • 기계학습
  • data analysis
  • 머신러닝강의

머신러닝 #온라인 #교육 #1편 #- #머신러닝의 #기초 #개념을 #잡아봅시다


YouTube에서 온라인 학습 머신 러닝 주제의 다른 동영상 보기

주제에 대한 기사를 시청해 주셔서 감사합니다 머신러닝 온라인 교육 1편 – 머신러닝의 기초 개념을 잡아봅시다 | 온라인 학습 머신 러닝, 이 기사가 유용하다고 생각되면 공유하십시오, 매우 감사합니다.

Leave a Comment