Skip to content
DarkKaiser의 블로그
DarkKaiser의 블로그
  • 개발 관련 자료(노션)
  • Raspberry Pi(노션)
  • WD My Cloud(노션)
  • GitHub
DarkKaiser의 블로그

URL을 파싱하자

DarkKaiser, 2007년 7월 17일2023년 9월 6일

1. 요약

AfxParseURL()을 이용하여 URL을 파싱할 수 있다.

2. 본문

AfxParseURL()은 URL을 파싱하기위한 MFC 함수입니다. 사용법은 AfxParseURL의 인자로 URL의 문자열을 입력하면 서버와 프로토콜과 포트를 파싱해서 넘겨줍니다.

BOOL AFXAPI AfxParseURL( LPCTSTR pstrURL, DWORD& dwServiceType, CString& strServer, CString& strObject, INTERNET_PORT& nPort );

여기까지만 하면 너무 허전하죠… 그래서 MFC를 쓰지않는 프로그램에서는 이런 기능을 구현하기 위해 MFC소스를 분석해 보겠습니다.

BOOL AFXAPI AfxParseURL(LPCTSTR pstrURL, DWORD& dwServiceType, CString& strServer,
                        CString& strObject, INTERNET_PORT& nPort) 
{ 
    dwServiceType = AFX_INET_SERVICE_UNK;
    ASSERT(pstrURL != NULL); 
    if (pstrURL == NULL) 
        return FALSE;

    URL_COMPONENTS urlComponents; 
    memset(&urlComponents, 0, sizeof(URL_COMPONENTS)); 
    urlComponents.dwStructSize = sizeof(URL_COMPONENTS);

    urlComponents.dwHostNameLength = INTERNET_MAX_URL_LENGTH; 
    urlComponents.lpszHostName = strServer.GetBuffer(INTERNET_MAX_URL_LENGTH+1); /* ④ */ 
    urlComponents.dwUrlPathLength = INTERNET_MAX_URL_LENGTH; 
    urlComponents.lpszUrlPath = strObject.GetBuffer(INTERNET_MAX_URL_LENGTH+1); /* ⑤ */

    BOOL bRetVal = _AfxParseURLWorker(pstrURL, &urlComponents, dwServiceType, nPort,
                                      ICU_BROWSER_MODE); /* 이게 진짜 */

    strServer.ReleaseBuffer(); 
    strObject.ReleaseBuffer(); 
    return bRetVal; 
}

소스를 보시면 아시겠지만 구조체를 초기화 한다음에 _AfxParseURLWorker에서 모든 처리를 하게한 느낌을 줍니다. 그럼 _AfxParseURLWorker를 한번 보죠.

AFX_STATIC BOOL AFXAPI _AfxParseURLWorker(LPCTSTR pstrURL, 
              LPURL_COMPONENTS lpComponents, DWORD& dwServiceType, 
              INTERNET_PORT& nPort, DWORD dwFlags) 
{ 
    /* this function will return bogus stuff if lpComponents */ 
    /* isn't set up to copy the components */

    ASSERT(lpComponents != NULL && pstrURL != NULL); 
    if (lpComponents == NULL || pstrURL == NULL) 
        return FALSE; 
    ASSERT(lpComponents->dwHostNameLength == 0 || 
        lpComponents->lpszHostName != NULL); 
    ASSERT(lpComponents->dwUrlPathLength == 0 || 
        lpComponents->lpszUrlPath != NULL); 
    ASSERT(lpComponents->dwUserNameLength == 0 || 
        lpComponents->lpszUserName != NULL); 
    ASSERT(lpComponents->dwPasswordLength == 0 || 
        lpComponents->lpszPassword != NULL);

    ASSERT(AfxIsValidAddress(lpComponents, sizeof(URL_COMPONENTS), TRUE)); /* ① */

    LPTSTR pstrCanonicalizedURL; 
    TCHAR szCanonicalizedURL[INTERNET_MAX_URL_LENGTH]; 
    DWORD dwNeededLength = INTERNET_MAX_URL_LENGTH; 
    BOOL bRetVal; 
    BOOL bMustFree = FALSE; 
    DWORD dwCanonicalizeFlags = dwFlags & 
        (ICU_NO_ENCODE | ICU_DECODE | ICU_NO_META | 
        ICU_ENCODE_SPACES_ONLY | ICU_BROWSER_MODE); 
    DWORD dwCrackFlags = dwFlags & (ICU_ESCAPE | ICU_USERNAME);

    bRetVal = InternetCanonicalizeUrl(pstrURL, szCanonicalizedURL, 
        &dwNeededLength, dwCanonicalizeFlags); /* ② */

    if (!bRetVal) 
    { 
        if (::GetLastError() != ERROR_INSUFFICIENT_BUFFER) 
            return FALSE;

        pstrCanonicalizedURL = new TCHAR[dwNeededLength]; 
        bMustFree = TRUE; 
        bRetVal = InternetCanonicalizeUrl(pstrURL, pstrCanonicalizedURL, 
            &dwNeededLength, dwCanonicalizeFlags); 
        if (!bRetVal) 
        { 
            delete [] pstrCanonicalizedURL; 
            return FALSE; 
        } 
    } 
    else 
        pstrCanonicalizedURL = szCanonicalizedURL;

    /* now that it's safely canonicalized, crack it */

    bRetVal = InternetCrackUrl(pstrCanonicalizedURL, 0, 
        dwCrackFlags, lpComponents); /* ③ */ 
    if (bMustFree) 
        delete [] pstrCanonicalizedURL;

    /* convert to MFC-style service ID */

    if (!bRetVal) 
        dwServiceType = AFX_INET_SERVICE_UNK; 
    else 
    { 
        nPort = lpComponents->nPort; 
        switch (lpComponents->nScheme) 
        { 
        case INTERNET_SCHEME_FTP: 
            dwServiceType = AFX_INET_SERVICE_FTP; 
            break;

        case INTERNET_SCHEME_GOPHER: 
            dwServiceType = AFX_INET_SERVICE_GOPHER; 
            break;

        case INTERNET_SCHEME_HTTP: 
            dwServiceType = AFX_INET_SERVICE_HTTP; 
            break;

        case INTERNET_SCHEME_HTTPS: 
            dwServiceType = AFX_INET_SERVICE_HTTPS; 
            break;

        case INTERNET_SCHEME_FILE: 
            dwServiceType = AFX_INET_SERVICE_FILE; 
            break;

        case INTERNET_SCHEME_NEWS: 
            dwServiceType = AFX_INET_SERVICE_NNTP; 
            break;

        case INTERNET_SCHEME_MAILTO: 
            dwServiceType = AFX_INET_SERVICE_MAILTO; 
            break;

        default: 
            dwServiceType = AFX_INET_SERVICE_UNK; 
        } 
    }

    return bRetVal; 
}

죄송합니다. 너무 길군요. 이렇게 긴것 같지 않았는데. ^ ^ㆀ

①에서 AfxIsValidAddress()를 이용하여 값이 유효한지 확인합니다.

AfxIsValidAddress()가 마치 URL이 옳바르게 쓰여는지 검사하는것 같은 분위기를 풍기는데 그냥 IsBadReadPtr()만 사용하여 메모리가 유효한지만 검사합니다.

②에서 InternetCanonicalizeUrl()를 통하여 URL이 정돈됩니다.

③에서 InternetCrackUrl()를 이용하여 실질적인 파싱을하는데 URL_COMPONENTS 라는 구조체를 이용했습니다. 그리고 나서 그냥 끝인데… 그럼 다시 AfxParseURL() 소스로 돌아가서 값이 어떻게 넘겨지는지 봐야겠습니다.

④에서 서버명을 그리고 ⑤에서 객체(파일)명의 CString 객체의 버퍼를 지정한것을 알 수 있습니다. 이렇게 분석을 해보니 우리가 이런 역활을 하는 프로그램을 만드는데 필요한것은 결국 InternetCrackUrl()뿐이군요. ^ ^

C/C++/VC++ AfxParseURLURL

글 내비게이션

Previous post
Next post

답글 남기기 응답 취소

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

최신 글

  • AssertJ 소개testCompile ‘org.assertj:assertj-core:3.6.2’ 2017년 9월 14일
  • 자주 사용되는 Lombok 어노테이션 2017년 9월 14일
  • 유니코드 #3 2017년 9월 14일
  • 유니코드 #2 2017년 9월 14일
  • 유니코드 #1 2017년 9월 14일

최신 댓글

    카테고리

    • 개인 자료 (1)
      • 일기 (1)
    • 주절주절 (7)
    • 프로그래밍 갤러리 (16)
    • 프로그래밍 언어 (186)
      • Java (29)
      • C/C++/VC++ (114)
      • C# (11)
      • Visual Basic (6)
      • 안드로이드 (9)
      • Objective-C (5)
      • JavaScript (4)
      • JSP/Servlet (2)
      • Python (4)
      • 어셈블러 (1)
    • 개발++ (44)
      • Book (11)
        • Joel On Software (10)
      • 프로젝트 관리 (6)
      • Maven (1)
      • 디버깅 (1)
      • DirectX (1)
      • Silverlight (1)
      • RESTful (1)
      • Hacking (1)
      • WDM (4)
      • VoIP (5)
      • 기타 (1)
    • 개발 도구 (15)
      • eclipse (14)
      • Sublime Text (1)
    • 네트워크 (7)
    • 설치 및 배포 (7)
      • InstallShield (2)
      • NSIS (4)
    • 버전 관리 (9)
      • Git (2)
      • CVS (2)
      • Subversion (5)
    • 데이터베이스 (7)
      • Oracle (3)
      • Sybase (2)
      • MS-SQL (2)
    • 단위테스트 (3)
      • JUnit (1)
      • NUnit (2)
    • 버그추적시스템 (2)
      • mantis (2)
    • 운영체제 (7)
      • Windows (5)
      • 리눅스 (2)
    • WAS (3)
      • WebLogic (3)
    • 디자인패턴 (1)
    • 디지털 이미지 프로세싱 (16)

    태그

    Abstract ActiveX AfxParseURL Automation boost devenv.exe event EventLogTraceListener Hover interface IO iTextSharp JAD jar JavaScript Joel Leave MFC Monitor msdev.com MSDN mutable PDF Properties RAW Saturation SHGetFolderPath SHGetKnownFolderPath SQLite STLTask String TextWriterTraceListener URL VI 권한 데이터소스 디컴파일러 문자열 스레드 동기화 스레드 생성 실용주의 프로그래머 자동화 테스팅 파일포맷 프리컴파일

    메타

    • 로그인
    • 엔트리 피드
    • 댓글 피드
    • WordPress.org
    ©2025 DarkKaiser의 블로그 | WordPress Theme by SuperbThemes