Browse AI는 어떤 웹사이트를 지원하나요?

AI 실습 튜토리얼1 년 전 게시 됨 Sharenet.ai
1.5K 0
吐司AI

Browse AI는 모든 웹사이트에 적용하는 것을 목표로 설계되었지만 몇 가지 제한 사항이 있습니다.

 

새로 생성된 사용자 지정 봇의 성공 확률은 약 90%입니다. 나머지 10%의 실패 사례는 주로 다음과 같은 이유로 인해 발생합니다:

1. 일부 유형의 캡차(예: 리캡차, h캡차)만 해결할 수 있으며, 모든 유형의 캡차를 해결할 수는 없습니다. 예를 들어, 현재 사용자 지정 CAPTCHA는 해결할 수 없습니다.

2. 일부 웹사이트에는 강력한 봇 탐지 메커니즘이 있습니다. Browse AI는 일반 사용자와 유사한 브라우저 세션을 사용하여 지연, 일시 정지, 스크롤 등을 통해 최대한 사람의 행동을 모방하려고 노력합니다. 또한 IP 주소(일반적으로 봇 설정자가 위치한 국가의 IP를 선택)를 변경하고 동일한 IP 주소를 사용하지 않도록 노력합니다.

그러나 당사가 어떤 조치를 취하든 봇이 사이트에 로그인해야 하는 경우(세션 쿠키를 사용하든 로그인 자격 증명을 사용하든) 사이트에서는 항상 두 가지를 감지할 수 있습니다: A) 이 사용자가 최소 두 개의 다른 IP 주소(로컬 IP와 Browse AI의 IP)에서 로그인하고 있다는 점, B) 봇이 상당히 많은 작업을 실행하는 경우 의심을 받을 수 있다는 점입니다.

따라서 클라우드 기반 웹 자동화를 사용할 때 로그인 상태의 봇이 탐지될 위험이 더 높습니다. 이 문제를 우회하기 위해 로컬 컴퓨터에서 자동화를 실행할 수 있지만 현재 이 기능은 지원되지 않습니다.

3. 사이트에 A/B 테스트가 있는 경우, 봇을 학습시킨 버전과 봇이 작업을 수행할 때 접하는 버전이 다르면 작업을 완료하지 못하거나 잘못된 데이터를 수집하는 데 실패할 수 있습니다. 봇은 일부 변경 사항에 적응할 수 있지만 전부는 아닙니다.

4. 일부 사이트에서는 **가상 목록**을 렌더링합니다. 이러한 목록은 스크롤을 내릴 때 보이는 항목만 렌더링하고 보이지 않는 부분은 전혀 렌더링하지 않습니다. 저희 소프트웨어는 아직 이러한 목록과 호환되지 않지만 향후 이를 지원할 계획입니다.

5. 아직 iFrame과의 상호 작용 또는 iFrame의 데이터 크롤링은 지원하지 않습니다. 이 문제를 해결하는 한 가지 방법은 아이프레임을 확인하여 URL을 찾는 것입니다. 일부 아이프레임에는 아이프레임을 직접 로드하는 데 사용할 수 있는 URL이 있으며, 새 봇을 학습시켜 아이프레임을 로드하고 상호 작용하거나 정보를 추출하도록 할 수 있습니다.

그럼에도 불구하고 웹에는 수십억 개의 웹사이트가 존재하기 때문에 접근하기 어려운 코드나 사이트 규칙을 위반하는 패턴으로 인해 발생하는 엣지 케이스는 항상 존재합니다. 새로운 엣지 케이스가 발생할 때마다 이러한 문제와 유사한 문제를 해결하기 위해 소프트웨어를 업데이트하려고 노력합니다.

 

방금 만든 새 사용자 지정 봇이 위와 다른 이유로 중단되었나요?

'신고' 버튼을 이용해 알려주세요. 최대한 빨리 연락드리겠습니다.

© 저작권 정책
AiPPT

관련 문서

댓글 없음

없음
댓글 없음...