[go: up one dir, main page]
More Web Proxy on the site http://driver.im/

WO2015004730A1 - 検索方法及び電子機器 - Google Patents

検索方法及び電子機器 Download PDF

Info

Publication number
WO2015004730A1
WO2015004730A1 PCT/JP2013/068741 JP2013068741W WO2015004730A1 WO 2015004730 A1 WO2015004730 A1 WO 2015004730A1 JP 2013068741 W JP2013068741 W JP 2013068741W WO 2015004730 A1 WO2015004730 A1 WO 2015004730A1
Authority
WO
WIPO (PCT)
Prior art keywords
stroke
search
filled portion
strokes
handwritten
Prior art date
Application number
PCT/JP2013/068741
Other languages
English (en)
French (fr)
Inventor
筒井 秀樹
Original Assignee
株式会社 東芝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社 東芝 filed Critical 株式会社 東芝
Priority to PCT/JP2013/068741 priority Critical patent/WO2015004730A1/ja
Priority to JP2013541097A priority patent/JP5666011B1/ja
Priority to US14/252,678 priority patent/US20150016725A1/en
Publication of WO2015004730A1 publication Critical patent/WO2015004730A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • G06V30/347Sampling; Contour coding; Stroke extraction

Definitions

  • the embodiment of the present invention relates to a technique for processing a handwritten document.
  • the user can instruct the electronic device to execute the function associated with the menu or object by touching the menu or object displayed on the touch screen display with a finger or the like. Further, the user can create a handwritten document including a plurality of strokes by handwriting characters, figures, tables, and the like with a pen or a finger on the touch screen display.
  • a handwriting search function is required to efficiently search for handwritten documents including necessary character strings from a large number of handwritten documents.
  • a technique for efficiently searching for a desired handwritten document is not sufficient.
  • An object of one embodiment of the present invention is to provide a search method and an electronic apparatus that can efficiently search a handwritten document.
  • the search method inputs a first stroke including at least one stroke that is a search key, and when the first stroke includes a second stroke corresponding to a first filled portion, Information on the stroke corresponding to the search key is acquired from the handwritten document using the third stroke excluding the second stroke of the first stroke.
  • FIG. 1 is an exemplary perspective view illustrating an appearance of an electronic apparatus according to an embodiment.
  • FIG. 2 is an exemplary diagram illustrating a cooperative operation between the electronic device of the embodiment and an external device.
  • FIG. 3 is a diagram illustrating an example of a handwritten document handwritten on the touch screen display according to the embodiment.
  • FIG. 4 is a diagram illustrating an example of time-series information in the embodiment.
  • FIG. 5 is an exemplary block diagram illustrating a system configuration of the electronic device according to the embodiment.
  • FIG. 6 is an exemplary block diagram illustrating a functional configuration of a handwriting input application program executed by the electronic apparatus of the embodiment.
  • FIG. 7 is a flowchart illustrating an example of a procedure for creating a handwritten document in the embodiment.
  • FIG. 8 is a flowchart illustrating an example of a fill determination process according to the embodiment.
  • FIG. 9 is a diagram illustrating an example of a stroke in the embodiment.
  • FIG. 10 is an example of a stroke in the embodiment.
  • FIG. 11 is an example of a stroke in the embodiment.
  • FIG. 12 is a diagram illustrating an example in which a graphic representing filling is handwritten by a plurality of strokes in the embodiment.
  • FIG. 13 is a diagram illustrating an example in which a graphic representing the filling in the embodiment is handwritten.
  • FIG. 14 is a flowchart illustrating the first search process in the embodiment.
  • FIG. 15 is a diagram illustrating an example of a handwriting search screen in the embodiment.
  • FIG. 16 is a diagram illustrating an input example of a query stroke in the embodiment.
  • FIG. 17 is a diagram illustrating an example of a handwriting search screen in the embodiment.
  • FIG. 18 is a flowchart illustrating the second search process in the embodiment.
  • FIG. 19 is a diagram for explaining the processing contents of the diagram search in the embodiment.
  • FIG. 20 is a diagram illustrating a state in which strokes are input by handwriting in the embodiment.
  • FIG. 21 is a diagram illustrating a relationship between the number of sample points of handwritten strokes and the sample point density in the embodiment.
  • FIG. 22 is a diagram illustrating stroke division in the embodiment.
  • FIG. 23 is a diagram illustrating an example of a surface stroke in the embodiment.
  • FIG. 24 is a diagram illustrating an example of a surface stroke in the embodiment.
  • FIG. 1 is a perspective view illustrating an external appearance of an electronic apparatus according to an embodiment.
  • the electronic device is, for example, a portable electronic device that can be handwritten with a pen or a finger.
  • the electronic device can be realized as a tablet computer, a notebook personal computer, a smartphone, a personal digital assistant (PDA), or the like.
  • PDA personal digital assistant
  • a case where the electronic device is realized as the tablet computer 10 will be described as an example.
  • the tablet computer 10 is a portable electronic device also called a tablet or a slate computer, and includes a main body 11 and a touch screen display 17 as shown in FIG.
  • the main body 11 has a thin box-shaped housing.
  • the touch screen display 17 is attached to be superposed on the upper surface of the main body 11.
  • the touch screen display 17 incorporates a flat panel display and a sensor configured to detect a contact position of a pen or a finger on the screen of the flat panel display.
  • the flat panel display may be, for example, a liquid crystal display (LCD).
  • As the sensor for example, a capacitive touch panel, an electromagnetic induction digitizer, or the like can be used. In the following, it is assumed that two types of sensors, a digitizer and a touch panel, are incorporated in the touch screen display 17.
  • the digitizer is arranged, for example, on the lower side of the flat panel display screen.
  • a touch panel is arrange
  • the touch screen display 17 can detect not only a touch operation on a screen using a finger but also a touch operation on a screen using the pen 100.
  • the pen 100 may be an electromagnetic induction pen, for example.
  • the user can perform a handwriting input operation on the touch screen display 17 using an external object (the pen 100 or a finger). During the handwriting input operation, the trajectory of the movement of the external object (the pen 100 or the finger) on the screen, that is, the stroke trajectory (handwriting) handwritten by the handwriting input operation is drawn in real time. Displayed on the screen.
  • the trajectory of the movement of the external object while the external object is in contact with the screen corresponds to one stroke.
  • a set of many strokes corresponding to handwritten characters or figures, that is, a set of many trajectories (handwriting) constitutes a handwritten document.
  • the handwritten document is stored in the storage medium as time series information indicating the order relation between the coordinate data string of the trajectory of each stroke and the stroke, not the image data. Details of the time-series information will be described later with reference to FIG.
  • the time-series information indicates the order in which a plurality of strokes are handwritten, and includes a plurality of stroke data respectively corresponding to the plurality of strokes.
  • the time series information means a set of time series stroke data respectively corresponding to a plurality of strokes.
  • Each stroke data corresponds to a certain stroke, and includes a coordinate data series (time series coordinates) corresponding to each point on the locus of this stroke.
  • the order of arrangement of the plurality of stroke data corresponds to the order in which each stroke is handwritten, that is, the stroke order.
  • the tablet computer 10 reads existing arbitrary time-series information (handwritten document) from the storage medium, and displays a handwritten document corresponding to this time-series information, that is, a trajectory corresponding to each of a plurality of strokes indicated by this time-series information. Can be displayed above. Furthermore, the tablet computer 10 has an editing function. This editing function deletes or deletes arbitrary strokes or arbitrary handwritten characters in the displayed handwritten document according to the editing operation by the user using the “eraser” tool, the range specification tool, and other various tools. Can move. Further, this editing function includes a function for canceling a history of some handwriting operations.
  • the tablet computer 10 also has a handwriting search (stroke search) function.
  • the handwriting search is any kind of handwriting search as long as one or more strokes (query strokes) handwritten as a search key (query stroke) can be searched from any handwritten document corresponding to the query stroke. Also good.
  • a handwritten document including one or more strokes corresponding to one or more query strokes can be searched from a storage medium.
  • the one or more strokes corresponding to the one or more query strokes may be, for example, one or more strokes similar to the one or more query strokes.
  • one or more strokes having a feature amount similar to the feature amount of the query stroke are searched from the handwritten document by matching (stroke matching) between the query stroke and each of a plurality of strokes in the handwritten document.
  • stroke matching is executed for each stroke in the query stroke group.
  • any feature that can represent a handwritten feature of this stroke can be used.
  • feature amount data representing a stroke shape, stroke stroke direction, stroke inclination, and the like may be used as the feature amount.
  • the handwriting search function allows a user to easily find a desired handwritten document from a large number of handwritten documents created in the past, and allows a user to easily find a desired handwritten portion from a certain handwritten document. To do.
  • the handwriting search can search not only handwritten characters but also handwritten figures, handwritten marks, and the like.
  • the above-described time-series information can be managed as one or a plurality of pages.
  • a group of time-series information that fits on one screen may be recorded as one page by dividing the time-series information (handwritten document) by an area unit that fits on one screen.
  • the page size may be variable.
  • the page size can be expanded to an area larger than the size of one screen, a handwritten document having an area larger than the screen size can be handled as one page.
  • the page may be reduced, or the display target portion in the page may be moved by vertical and horizontal scrolling.
  • FIG. 2 shows an example of cooperative operation between the tablet computer 10 and an external device.
  • the tablet computer 10 can cooperate with the personal computer 1 and the cloud. That is, the tablet computer 10 includes a wireless communication device such as a wireless LAN, and can execute wireless communication with the personal computer 1. Furthermore, the tablet computer 10 can also execute communication with the server 2 on the Internet.
  • the server 2 may be a server that executes an online storage service and other various cloud computing services.
  • the personal computer 1 includes a storage device such as a hard disk drive (HDD).
  • the tablet computer 10 can transmit time-series information (handwritten document) to the personal computer 1 through the network and record it on the HDD of the personal computer 1 (upload).
  • the personal computer 1 may authenticate the tablet computer 10 at the start of communication.
  • a dialog prompting the user to input an ID or password may be displayed on the screen of the tablet computer 10, and the ID of the tablet computer 10 and the like are automatically transmitted from the tablet computer 10 to the personal computer 1. May be.
  • the tablet computer 10 can handle a large amount of time-series information (handwritten document) or a large amount of time-series information (handwritten document).
  • the tablet computer 10 reads (downloads) any one or more handwritten documents recorded in the HDD of the personal computer 1, and displays the trajectory of each stroke indicated by the read handwritten document on the display 17 of the tablet computer 10. Can be displayed on the screen.
  • a list of thumbnails obtained by reducing each page of a plurality of handwritten documents may be displayed on the screen of the display 17, and one page selected from these thumbnails is usually displayed on the screen of the display 17. You may display by size.
  • the destination to which the tablet computer 10 communicates may be the server 2 on the cloud that provides a storage service or the like, as described above, instead of the personal computer 1.
  • the tablet computer 10 can transmit a handwritten document to the server 2 via the network and record it in the storage device 2A of the server 2 (upload). Furthermore, the tablet computer 10 reads out (downloads) an arbitrary handwritten document recorded in the storage device 2A of the server 2, and displays the trajectory of each stroke indicated by the handwritten document on the screen of the display 17 of the tablet computer 10. can do.
  • the storage medium in which the handwritten document is stored may be any one of the storage device in the tablet computer 10, the storage device in the personal computer 1, and the storage device in the server 2.
  • the system of the present embodiment capable of executing the handwriting search described above may be a local system realized in the tablet computer 10, but is a system (server system) configured by one or more servers. May be.
  • the tablet computer 10 is a client terminal capable of executing a process of transmitting a query stroke group to the server system and a process of receiving a search result from the server system and displaying the search result on the screen of the tablet computer 10. May function.
  • FIG. 3 shows an example of strokes handwritten on the touch screen display 17 using the pen 100 or the like.
  • FIG. 3 shows an example in which a stroke representing a filled figure (hereinafter may be referred to as a filled portion) and a stroke representing a character string “Subject” are handwritten.
  • a stroke representing a filled figure hereinafter may be referred to as a filled portion
  • a stroke representing a character string “Subject” are handwritten.
  • a stroke whose stroke direction is repeatedly changed up and down and a stroke whose stroke direction is repeatedly changed left and right are superimposed.
  • a black square figure is expressed by superimposing two strokes.
  • the stroke of the filled portion and the stroke of the character are sampled in real time at regular time intervals, for example, and time series coordinate data is obtained.
  • time series coordinate data SD11, SD12,... SD1a are acquired for the first input stroke
  • time series coordinate data SD21, SD22,... SD2b are obtained for the next input stroke.
  • FIG. 4 shows time-series information 200 corresponding to the handwritten stroke sequence of FIG.
  • the time series information 200 includes a plurality of stroke data SD1, SD2,.
  • these stroke data SD1, SD2,..., SD7 are arranged in time series in the order of handwriting, that is, the order in which a plurality of strokes are handwritten.
  • Each stroke data includes a coordinate data series (time series coordinates) corresponding to one stroke, that is, a plurality of coordinate data corresponding to a plurality of points on one stroke.
  • the plurality of coordinate data are arranged in time series in the order in which the strokes are written.
  • the stroke data SD1 corresponding to the first stroke corresponding to the filled portion shown in FIG. 4 is a coordinate data series (time series coordinates) corresponding to a point on the stroke locus, that is, a piece of coordinate data SD11, SD12. ,..., SD1a
  • the stroke data SD2 corresponding to the next stroke similarly includes b coordinate data SD21, SD22,.
  • the stroke data SD3 corresponding to the handwritten character “S” includes c coordinate data SD31, SD32,... SD3c. Note that the number of coordinate data corresponding to one stroke is sampled in real time at equal time intervals, and thus differs depending on the time when the stroke is handwritten. That is, the longer the time during which a stroke is handwritten, the greater the number of coordinate data.
  • the coordinate data in the stroke data indicates an X coordinate and a Y coordinate corresponding to one point on the stroke locus.
  • the coordinate data SD11 indicates the start point coordinates (X11, Y11) of the first stroke
  • the coordinate data SD1a indicates the end point coordinates (X1a, Y1a) of the first stroke.
  • handwritten documents are stored not as images or character recognition results but as a set of time-series stroke data, handwritten characters can be handled without depending on the language of handwritten characters. Therefore, the structure of the handwritten document (time-series information 200) of the present embodiment can be used in common in various countries around the world with different languages.
  • a label 201 indicating whether or not the stroke is a filled portion is added to the time series information 200 for each stroke data. Whether or not the stroke is a filled portion is determined by a fill determination process described later.
  • a label “surface” indicating a surface stroke is added to the stroke determined as a stroke of the filled portion by the fill determination processing, and a label “line” indicating a line stroke is added to the stroke determined not to be a stroke of the filled portion. "Is added.
  • the labels added for each stroke can be merged to add labels corresponding to the plurality of strokes.
  • FIG. 4 shows an example in which a merged label 202 (label “surface”) is added to two strokes representing a filled portion.
  • At least one of the strokes to be merged is a surface stroke such as strokes SD1 and SD2 shown in FIG. 4, and a part of the coordinate data included in each stroke data overlaps. it can.
  • the label “surface” may be added by merging three or more strokes, or the label “surface” may be added by merging a combination of the surface stroke and the line stroke.
  • a plurality of strokes having adjacent coordinate data may be merged.
  • the outline may be filled after the outline of the figure is handwritten.
  • the filled figure is composed of a stroke representing the outline and a stroke corresponding to the filled portion, and therefore, the label “surface” is added by merging the outline and the stroke of the filled portion.
  • the determination of the adjacent strokes is made, for example, when the coordinate data of two strokes are within a predetermined distance (including the case where they match), and the number of coordinate data within the predetermined distance is a predetermined number. If there are more, it is determined that the strokes are close.
  • FIG. 5 shows a system configuration of the tablet computer 10.
  • the tablet computer 10 includes a CPU 101, a system controller 102, a main memory 103, a graphics controller 104, a BIOS-ROM 105, a nonvolatile memory 106, a wireless communication device 107, an embedded controller (EC) 108, and the like.
  • the CPU 101 is a processor that controls the operation of various modules in the tablet computer 10.
  • the CPU 101 executes various software loaded into the main memory 103 from the nonvolatile memory 106 that is a storage device.
  • the software includes an operating system (OS) 103a and various application programs.
  • the application program includes a handwriting input application program 103b.
  • the handwriting input application program 103b has a function for creating and displaying the above-mentioned handwritten document, a function for editing a handwritten document, a handwriting search function, a recognition function, and the like.
  • the CPU 101 also executes a basic input / output system (BIOS) stored in the BIOS-ROM 105.
  • BIOS is a program for hardware control.
  • the system controller 102 is a device that connects between the local bus of the CPU 101 and various components.
  • the system controller 102 also includes a memory controller that controls access to the main memory 103.
  • the system controller 102 also has a function of executing communication with the graphics controller 104 via a serial bus or the like.
  • the graphics controller 104 is a display controller that controls the LCD 17 ⁇ / b> A used as a display monitor of the tablet computer 10.
  • a display signal generated by the graphics controller 104 is sent to the LCD 17A.
  • the LCD 17A displays a screen image based on the display signal.
  • a touch panel 17B and a digitizer 17C are arranged on the LCD 17A.
  • the touch panel 17B is a capacitance-type pointing device for inputting on the screen of the LCD 17A.
  • the touch position on the screen where the finger is touched and the movement of the touch position are detected by the touch panel 17B.
  • the digitizer 17C is an electromagnetic induction type pointing device for inputting on the screen of the LCD 17A.
  • the digitizer 17C detects the contact position on the screen where the pen 100 is touched, the movement of the contact position, and the like.
  • the wireless communication device 107 is a device configured to perform wireless communication such as wireless LAN or 3G mobile communication.
  • the EC 108 is a one-chip microcomputer including an embedded controller for power management.
  • the EC 108 has a function of turning on or off the tablet computer 10 in accordance with the operation of the power button by the user.
  • the handwriting input application program 103b includes a pen locus display processing unit 301, a time-series information generation unit 302, an editing processing unit 303, a page storage processing unit 304, a page acquisition processing unit 305, a handwritten document display processing unit 306, and a query stroke input unit 307. , A search processing unit 308, a fill determination unit 309, and the like.
  • the handwriting input application program 103b creates, displays, and edits a handwritten document (handwritten data) by using the stroke data input using the touch screen display 17.
  • the touch screen display 17 is configured to detect the occurrence of events such as “touch”, “move (slide)”, and “release”. “Touch” is an event indicating that an external object has touched the screen. “Move (slide)” is an event indicating that the contact position has been moved while an external object is in contact with the screen. “Release” is an event indicating that an external object has been released from the screen.
  • the pen locus display processing unit 301 and the time-series information generation unit 302 receive a “touch” or “move (slide)” event generated by the touch screen display 17, and detect a handwriting input operation based on the event.
  • the “touch” event includes coordinate data of the contact position.
  • the “movement (slide)” event also includes coordinate data of the contact position of the movement destination. Therefore, the pen locus display processing unit 301 and the time-series information generation unit 302 can receive a coordinate data string corresponding to the movement locus of the contact position from the touch screen display 17.
  • the pen locus display processing unit 301 receives the coordinate data string from the touch screen display 17, and based on the coordinate data string, displays a plurality of stroke locus input by a handwriting input operation using the pen 100 or the like on the touch screen display. 17 on the screen of the LCD 17A.
  • the pen locus display processing unit 301 draws the locus of the pen 100 while the pen 100 is in contact with the screen, that is, the locus of each stroke, on the screen of the LCD 17A.
  • the time series information generation unit 302 receives a coordinate data string output from the touch screen display 17 when a user performs a handwriting input operation, and based on this coordinate data string, stroke data (time series information) is received. Generate.
  • the stroke data (time series information) may be temporarily stored in the work memory 401.
  • the page storage processing unit 304 stores a plurality of stroke data corresponding to a plurality of strokes in the storage medium 402.
  • the storage medium 402 may be any of a storage device in the tablet computer 10, a storage device in the personal computer 1, and a storage device in the server 2.
  • the page acquisition processing unit 305 reads a handwritten document stored in the storage medium 402.
  • the read handwritten document is sent to the handwritten document display processing unit 306.
  • the handwritten document display processing unit 306 analyzes the handwritten document, and displays a plurality of strokes (trajectories) indicated by the plurality of stroke data in the handwritten document as handwritten pages on the screen based on the analysis result.
  • the editing processing unit 303 executes processing for editing the handwritten document (handwritten page) currently being displayed. That is, the edit processing unit 303 executes an edit process for deleting or moving one or more strokes among the plurality of displayed strokes in accordance with an edit operation performed by the user on the touch screen display 17. . Further, the edit processing unit 303 updates the handwritten document in order to reflect the result of the editing process on the displayed handwritten document.
  • the user can delete any of the displayed strokes using the “Eraser” tool or the like. Further, the user can specify a range of an arbitrary portion in the displayed handwritten page by using a “range specification” tool for enclosing an arbitrary portion on the screen by a circle or a square.
  • the fill determination unit 309 performs a fill determination process on the stroke data (time series information) generated by the time series information generation unit 302, and determines whether or not the stroke is a stroke (surface stroke) that represents a filled portion. Determine.
  • the fill determination unit 309 determines whether or not the stroke is a fill portion with respect to the stroke data (time-series information 200) stored in the storage medium 402 by the page storage processing unit 304 according to the determination result for each stroke. A label 201 indicating is added.
  • the fill determination unit 309 similarly performs a fill determination process for the query stroke input for handwriting search, and determines a stroke representing a filled portion.
  • the query stroke input unit 307 inputs a query stroke used as a search key in a search process (handwriting search) by the search processing unit 308, and causes the search processing unit 308 to execute a search process using the query stroke.
  • a query stroke one or more strokes input by the user's handwriting input operation can be used on the handwriting search screen displayed by the handwriting input application program 103b. Further, one or more strokes selected from the handwritten page by the handwriting input operation by the user can be used as the query stroke.
  • the query stroke input unit 307 designates a filled portion in the query stroke according to the determination result by the fill determination unit 309 for the query stroke, and causes the search processing unit 308 to execute the search process.
  • the search processing unit 308 includes a stroke search unit 310, a diagram search unit 311, a stroke division unit 312, and a circumscribed stroke creation unit 313 in order to execute handwriting search.
  • the stroke search unit 310 executes a handwriting search using the query stroke input by the query stroke input unit 307.
  • the stroke search unit 310 performs a handwriting search for searching for a stroke group corresponding to the query stroke from a handwritten document, with the stroke determined by the fill determination unit 309 as a line stroke.
  • the stroke search unit 310 may search for a stroke group having a feature amount similar to the feature amount of the query stroke from the handwritten document.
  • the query stroke includes one or more strokes, and each searched stroke group includes one or more strokes. As described above, as the feature amount of each stroke, the shape of the stroke, the stroke direction of the stroke, the inclination of the stroke, and the like may be used.
  • the stroke search unit 310 calculates similarity by treating each stroke as a vector.
  • each stroke may be resampled based on the original stroke data so that all strokes have the same number of points (number of samples).
  • the vector of each stroke may be converted into a difference vector.
  • a certain stroke includes coordinate data strings (x1, y1), (x2, y2), (x3, y3)
  • the coordinate data strings are (0, 0), (x2-x1, y2-y1).
  • (X3-x1, y3-y1) may be converted into a coordinate data string. Since all the strokes can be regarded as strokes written from the origin by such conversion, handwriting search can be performed regardless of the position in the handwritten page where each stroke is written.
  • any conversion method capable of normalizing the relative positional relationship of each stroke can be used.
  • vector coordinates of each stroke may be divided by the maximum width or height of each stroke to normalize the size of each stroke.
  • the inner product between the vectors to be compared may be calculated as the similarity between the vectors to be compared (difference vectors). Good.
  • feature amount data representing the feature amount of each stroke in the handwritten document may be calculated in advance, and this feature amount data may be stored in the database.
  • the stroke search unit 310 calculates a feature amount of the query stroke, and uses the feature amount of the query stroke and the feature amount data of each stroke in the database to obtain a feature amount similar to the feature amount of the query stroke. It is possible to search for a stroke group having the same. Further, in order to reduce the calculation amount, processing for reducing the dimension of the feature amount vector may be performed.
  • the query stroke is not a single stroke but a stroke sequence including a plurality of strokes in many cases.
  • the degree of similarity between this stroke and each of a plurality of strokes in the handwritten document is obtained.
  • a query stroke sequence similar to the query stroke sequence is searched from the handwritten document.
  • DP Dynamic Programming
  • similarity is calculated by treating strokes as vectors.
  • the similarity is calculated by calculating the similarity by treating the stroke as a vector.
  • the query stroke and the stroke in the handwritten document represent a solid figure such as a black circle or a black square
  • high similarity is not shown even if they are equivalent.
  • the stroke is not stable each time, for example, the length or direction of the stroke is different or a plurality of strokes are combined. For this reason, even if the strokes appear to be the same fill, the vectors indicating the strokes are different, so that the high similarity is not shown.
  • the stroke search unit 310 targets a stroke group corresponding to the query stroke from a handwritten document for a stroke that is not determined as a surface stroke by the fill determination unit 309, that is, a stroke that is determined as a line stroke. Perform a handwriting search to search.
  • the query stroke (search key) includes a stroke corresponding to the filled portion
  • the stroke search unit 310 corresponds to the search key from the handwritten document using the stroke excluding the stroke corresponding to the filled portion. It is possible to acquire information regarding the stroke to be performed.
  • the figure search unit 311 can perform a search process.
  • the figure search unit 311 performs a handwriting search using the query stroke input by the query stroke input unit 307.
  • the figure search unit 311 performs a handwriting search for searching for a stroke group corresponding to the query stroke from a handwritten document, with the stroke determined by the fill determination unit 309 as a surface stroke.
  • the figure search unit 311 treats the stroke by the stroke search unit 310 as a vector, and searches for a filled portion by a method different from the method of calculating the similarity between strokes.
  • the stroke dividing unit 312 divides one stroke into a stroke that represents a filled portion and a stroke other than the stroke for a stroke or query stroke in a handwritten document. By dividing each stroke into a plane stroke and a line stroke, the stroke search unit 310 and the diagram search unit 311 can execute search processing corresponding to each stroke.
  • the circumscribing stroke creating unit 313 converts the stroke determined by the fill determining unit 309 as a surface stroke, that is, the stroke representing the filled portion, into a circumscribing stroke. For example, a stroke representing a black circle figure is converted into a stroke circumscribing the black circle figure. In this case, the circumscribing stroke is replaced with an unfilled circular figure. Thereby, since the surface stroke is converted into a line stroke, the search processing by the stroke search unit 310 becomes possible.
  • the handwriting input application program 103b uses a stroke other than the filled portion for the filled portion when the query stroke input for handwriting search includes a stroke representing a filled portion such as a black circle or a black square. By performing processing different from the above, a handwritten document can be searched efficiently.
  • the pen locus display processing unit 301 displays the stroke locus input by handwriting on the touch screen display 17 (LCD 17A) based on the coordinate data string input from the touch screen display 17.
  • the time series information generation unit 302 generates stroke data (time series information) based on the coordinate data string input from the touch screen display 17 (step A2).
  • the time-series information generation unit 302 samples input coordinate data at regular time intervals and records sample points (coordinate data) to convert them into vector data. Examples of input stroke data include characters, graphs, diagrams, symbols, and the like.
  • the page storage processing unit 304 stores a plurality of stroke data corresponding to a plurality of strokes in the storage medium 402 as a handwritten document (handwritten page).
  • the fill determination unit 309 executes a fill determination process on the stroke data (time series information) generated by the series information generation unit 302 (step A3).
  • the fill determination process it is determined whether or not the stroke is a stroke (surface stroke) representing a filled portion.
  • the fill determination process may be executed every time stroke data for one stroke is generated, or may be executed collectively for a plurality of stroke data such as one page. For example, when a stroke data storage process is performed in accordance with an instruction from the user, a fill determination process is executed for each page. In the following description, it is assumed that the fill determination process is executed for each page.
  • FIG. 8 is a flowchart illustrating an example of a fill determination process according to the embodiment.
  • the fill determination unit 309 selects stroke data to be determined from a plurality of stroke data generated by the time series information generation unit 302 (step B1).
  • the stroke dividing process shown in step B2 is not an essential process, and details will be described later.
  • the fill determination unit 309 sets a circumscribed figure for the stroke based on the stroke data (step B3), and calculates the area of the circumscribed figure (step B4).
  • a stroke example 500 shown in FIG. 9 shows an example of a stroke 501 input to fill a square, for example, and a circumscribed figure 502 set for the stroke 501.
  • the circumscribed figure 502 is formed at a certain distance from the stroke 501 along the outer periphery of the stroke 501.
  • a circumscribed figure 502 surrounding the stroke 501 is formed as shown in FIG.
  • a stroke example 510 shown in FIG. 10 shows an example of a stroke 511 input to fill a circle, for example, and a circumscribed figure 512 set for the stroke 511. Since the stroke 511 forms a closed region, a circumscribed figure 512 is set along the stroke forming the outer periphery.
  • a stroke example 520 shown in FIG. 11 shows an example of a stroke 521 representing a general character or the like and a circumscribed figure 522 set for the stroke 521. As shown in the stroke example 520, in the case of a stroke 521 that does not represent a filled portion, a circumscribed figure 522 along the stroke 521 is set.
  • the fill determination unit 309 determines whether the area of the circumscribed figure set for the stroke is larger than the first threshold value for the preset area.
  • the first threshold is based on the area of the circumscribed figure set for the stroke, whether it is a stroke inputted with the intention of filling or a stroke inputted with the intention of a general character or figure. It is decided to discriminate.
  • strokes 501 and 511 shown in FIG. 9 and FIG. 10 are strokes that are input for the purpose of filling. Accordingly, the areas of the circumscribed figures 502 and 512 corresponding to the strokes 501 and 511 are relatively large. On the other hand, the area of the circumscribed figure 522 set for the general stroke 521 shown in FIG. 11 is relatively small unlike the circumscribed figures 502 and 512.
  • the fill determining unit 309 determines that the stroke to be determined is not a stroke representing the fill (Step B10).
  • the fill determining unit 309 calculates the density of the stroke in the circumscribed figure (step B6). For example, since the stroke data is converted into vector data by sample points, the fill determination unit 309 counts the number of sample points of the strokes to be determined, divides by the area of the circumscribed figure, and samples points per unit area Is the density.
  • the fill determination unit 309 determines whether the stroke density is greater than a second threshold value with respect to a preset stroke density.
  • the second threshold value is used to determine whether the stroke is input with the intention of filling or the stroke input with the intention of a general character or graphic based on the stroke area in the circumscribed graphic. It is decided to.
  • the fill determination unit 309 determines that the stroke to be determined is not a stroke representing the fill (Step B10). On the other hand, when the stroke density is larger than the second threshold value (Yes at Step B7), the fill determination unit 309 determines that the stroke to be determined is a stroke representing a filled portion (Step B8).
  • the stroke creation process shown in step B9 is not an essential process, and details will be described later.
  • the fill determination unit 309 determines whether all strokes have been determined. If there is stroke data that has not been determined (No in Step B11), the other stroke data is selected as a determination target (Step B1). Then, the same processing as described above is executed (steps B2 to B11). When the determination for all the strokes is completed (step B11, Yes), the fill determination unit 309 ends the fill determination process.
  • circumscribed figures 502, 512, and 522 are set for the strokes 501, 511, and 521, but a circumscribed rectangle may be set.
  • the fill determination unit 309 can determine a maximum value and a minimum value for each of the x coordinate and the y coordinate of the coordinate data (sample points) included in the stroke data, and set a circumscribed rectangle.
  • a circumscribed rectangle 503 set for the stroke 501 is shown in the stroke example 505 shown in FIG. 9.
  • a stroke example 515 shown in FIG. 10 shows a circumscribed rectangle 513 set for the stroke 511
  • a stroke example 525 shown in FIG. 11 shows a circumscribed rectangle 523 set for the stroke 521.
  • the circumscribed rectangle 523 shown in FIG. 11 has an area larger than the first threshold value, but has a smaller stroke density. Therefore, it is determined that the circumscribed rectangle 523 is not a stroke representing a filled portion, as in the case where the circumscribed figure 522 is set. .
  • the page storage processing unit 304 adds a label 201 indicating whether or not the stroke is a filled part to the stroke data (time-series information 200), and the stroke data Is recorded in the storage medium 402 (step A4). That is, the page storage processing unit 304 adds a label “surface” indicating a surface stroke to a stroke determined as a stroke of a filled portion, and applies a line stroke to a stroke determined as not a stroke of a painted portion. A label “line” is added (see FIG. 4).
  • the page storage processing unit 304 can add a merged label 202 (label “surface”) to a plurality of strokes representing a filled portion in addition to the label 201 for each stroke.
  • the fill determining unit 309 determines that, when at least one of the plurality of strokes is a surface stroke and a part of the coordinate data included in each stroke data overlaps, It is determined that the merged label can be added.
  • the page storage processing unit 304 adds the merged label “surface” to a plurality of strokes according to the determination result by the fill determination unit 309.
  • FIG. 12 shows an example in which a figure representing filling is handwritten by a plurality of strokes.
  • two strokes 530 and 531 are overlapped so that a stroke 532 representing a black square figure is handwritten.
  • the stroke 530 has a pattern in which the stroke direction is repeatedly changed up and down
  • the stroke 531 has a pattern in which the stroke direction is repeatedly changed in the left and right directions.
  • the merged label 202 is added to the two strokes 530 and 531 that are overlapped to create a filled figure or the like.
  • a merged label 202 can be added not only when a plurality of surface strokes are overlaid but also when a surface stroke and a line stroke are overlaid and handwritten.
  • FIG. 13 shows an example in which a figure 542 representing filling is handwritten by a stroke 540 corresponding to a line stroke and a plurality of strokes 541 corresponding to a surface stroke.
  • a contour line for example, a star shape
  • a plurality of strokes are input by hand so as to fill the contour line.
  • the fill determination unit 309 has the coordinate data of the two strokes within a predetermined distance (including the case where they match), and the coordinate data within the predetermined distance is determined in advance. If there are more than the number, it is determined that the strokes 540 and 541 constitute the figure 542 representing the filling.
  • the page storage processing unit 304 adds the merged label “surface” to the strokes 540 and 541. Accordingly, the stroke 540 of the line stroke can be handled in the same manner as the surface stroke.
  • FIG. 15 is a diagram showing an example of a handwriting search screen 600 presented to the user by the handwriting input application program 103b.
  • the handwriting search screen 600 displays a search key input area 551, a search button 551A, and a clear button 551B.
  • the search key input area 551 is an input area for handwriting a stroke (query stroke) to be used as a search key.
  • the search button 551A is a button for instructing execution of handwriting search processing.
  • the clear button 551B is a button for instructing to delete (clear) a character string or a graphic handwritten in the search key input area 551.
  • the handwriting search screen 600 may further display a plurality of handwritten page thumbnails 601. In the example of FIG. 15, nine handwritten page thumbnails 601 corresponding to each of nine handwritten documents are displayed.
  • a stroke representing a solid figure and a stroke representing a character string “Subject” are input as query strokes to the search key input area 551 on the search button 551A. It is assumed that a gesture (for example, a tap gesture) is detected.
  • the handwriting input application program 103b starts a handwriting search for searching, for example, a handwritten document corresponding to nine handwritten page thumbnails 601 for a group of strokes having a feature quantity similar to the query stroke.
  • the fill determination unit 309 executes a fill process for each stroke in the query stroke, and the surface stroke representing the filled portion, and the like (Step C2).
  • the filling process is performed in the same manner as described above, and detailed description thereof is omitted (see the flowchart shown in FIG. 8).
  • the query stroke input unit 307 inputs query stroke data, and causes the search processing unit 308 to execute a search process using the query stroke data as a search key. Further, the query stroke input unit 307 designates a filled portion in the query stroke determined by the fill determining unit 309.
  • the stroke search unit 310 of the search processing unit 308 is similar to the stroke group corresponding to the stroke (line stroke) excluding the filled portion (surface stroke) included in the query stroke, that is, the feature amount of the stroke excluding the filled portion. Is searched from a handwritten document whose search target is a stroke group higher than a predetermined criterion (step C3). For the search of strokes, for example, the similarity between vectors may be obtained in units of strokes, and a stroke matching the query may be searched by DP matching for a query of a plurality of strokes. Further, the search processing unit 308 displays the stroke group searched from the handwritten document on the handwriting search screen 600 (step C5). The process of step C4 shown in FIG. 14 will be described later.
  • handwritten page thumbnails of handwritten documents including query strokes whose similarity is higher than the criterion are displayed as search results.
  • FIG. 16 shows a case where a stroke group corresponding to a query stroke is searched from five handwritten pages among nine handwritten pages.
  • the stroke group corresponding to the query stroke is highlighted.
  • highlighting for example, a rectangular frame 602 is added to the searched stroke group, the display color of the searched stroke group is set to a color different from other strokes (for example, red), or the display mode of the stroke group is inverted. It can be in other forms such as a display.
  • the search processing unit 308 converts the handwritten page corresponding to the selected handwritten page thumbnail 601 to a normal size as shown in FIG. Is displayed on the handwriting search screen 600.
  • the stroke groups 602A, 602B, and 602C are searched.
  • the stroke groups 602A and 602B there are strokes 605A, 605B, and 605C representing the filled portions on the left side, respectively, but the search is executed by excluding these filled portions.
  • the stroke groups 602A and 602B corresponding to the query stroke representing the character string “Subject” can be accurately searched without being affected by the strokes 605A and 605B.
  • the stroke of the filled portion is often longer than the stroke representing a character or the like, the time required for calculating the similarity between strokes is relatively longer than the calculation of the similarity between strokes of characters.
  • the speed of the search process can be improved.
  • the search is performed by excluding the filled portion (surface stroke) included in the query stroke, but the stroke portion as the search result is narrowed down using the filled portion (surface stroke). Can do.
  • the stroke search unit 310 searches the stroke group searched by the process of step C3 shown in FIG. 14 including the stroke of the filled portion (step C4).
  • the stroke search unit 310 includes a stroke group in which the filled portion previously exists. Is selected from the stroke groups 602A, 602B, and 602C.
  • the stroke groups 602A and 602B are selected as search results.
  • the stroke group 602C is not selected because it corresponds only to the stroke excluding the filled portion in the query stroke.
  • the search process can be executed with higher accuracy by using the filled portion in the query stroke.
  • the stroke representing the filled portion is not recognized as a character or a figure, such as a black square or a black circle, for example. Therefore, a search process using the filled portion without increasing the processing required for the recognition process. Is possible.
  • the second search process in the present embodiment will be described with reference to the flowchart shown in FIG.
  • the similarity between the query stroke and the stroke in the handwritten document is not calculated for the stroke of the filled part.
  • the stroke of the filled part is not calculated in the document.
  • An evaluation value indicating a similarity relationship with the stroke is calculated and reflected in the search process.
  • Steps D1 and D2 shown in FIG. 18 are executed in the same manner as steps C1 and C2 shown in FIG.
  • the stroke search unit 310 performs a stroke search in the same manner as in the first search process for strokes (line strokes) that are not determined as filled portions in the query stroke. That is, a stroke search is performed for a stroke to which a label indicating a line stroke such as a handwritten document is added (step D4).
  • the figure search unit 311 graphs this stroke and calculates an evaluation value indicating a similarity relationship with the stroke in the handwritten document ( Step D5).
  • this processing is referred to as diagram search.
  • FIG. 19 is a diagram for explaining the processing contents of the diagram search.
  • FIG. 19 shows a surface stroke 700 of the query stroke and a surface stroke 710 in the handwritten document.
  • the figure search unit 311 sets circumscribed squares 701 and 711 for the surface stroke 700 of the query stroke and the surface stroke 710 in the handwritten document to be searched, so that the circumscribed squares 701 and 711 have the same size.
  • the surface strokes 700 and 710 are enlarged or reduced.
  • the circumscribed square 702 is obtained by reducing the circumscribed square 701
  • the circumscribed square 712 having the same size as the circumscribed square 702 is obtained by reducing the circumscribed square 711.
  • the figure retrieval unit 311 calculates a circumscribed figure for each of the surface stroke 703 obtained by reducing the surface stroke 700 and the surface stroke 713 obtained by enlarging the surface stroke 710, and each of the inside of the circumscribed figure is completely filled.
  • the similarity relationship with the figure is calculated.
  • the figure search unit 311 may superimpose the figures to be compared and evaluate the ratio of the area size of the overlapping portions as a score.
  • FIG. 19 shows a state in which a graphic 715 (query graphic A) corresponding to the circumscribed graphic of the surface stroke 703 and a graphic 705 (search target graphic B) corresponding to the circumscribed graphic of the surface stroke 713 are overlapped.
  • the stroke search unit 310 merges the respective search results (Ste D6).
  • the stroke search unit 310 converts the evaluation value (score S) calculated in the figure search into the similarity calculated in the stroke search, and follows the order in which the strokes are described in the same manner as in the stroke search. DP matching is performed. Thereby, it is possible to search the storage medium 402 for a stroke that matches the query stroke among the strokes in the handwritten document.
  • the similarity between the query stroke (line stroke) and the stroke in the handwritten document is calculated in the range of ( ⁇ 1 to +1), for example.
  • the strokes of the same shape in the same stroke direction have a similarity of +1, and the strokes of the same shape in opposite stroke directions have a similarity of -1.
  • the score S is calculated in the range of 0 to +1. In this case, the score S of the figure search is converted into the similarity 0 to +1 of the stroke search.
  • the search processing unit 308 displays the stroke group searched from the handwritten document on the handwriting search screen 600 as in the first search process described above (step D7).
  • the search process can be performed not only when a stroke including a filled part is input as a query stroke but also when a stroke including only a filled part is input. it can. It is also possible to search for a figure in which a line stroke and a surface stroke are mixed. For example, in a mark or figure that combines a line and a point, such as a fermata mark, a treble clef, and an eighth note mark, a search can be performed even when the point is handwritten with a black circle.
  • step B2 of FIG. 8 the stroke dividing process shown in step B2 of FIG. 8 will be described.
  • determination is made in units of strokes.
  • the filled portion and the other sub-strokes are included. To divide.
  • the stroke dividing unit 312 generates substrokes based on the stroke data input when creating a handwritten document and the query stroke data input for search processing.
  • FIG. 20 shows a state where one stroke is input by handwriting.
  • FIG. 20 shows an example in which a stroke representing a quarter note is input by handwriting, and a line portion is input after a black circle portion is input first.
  • the stroke dividing unit 312 sets a circumscribed figure (which may be a circumscribed rectangle for simplicity of calculation) from the beginning of the sample point to a certain number of n sample points based on the stroke data of one stroke.
  • the density of the sample points (stroke density) is obtained based on the number of sample points of the stroke in the circumscribed figure and the area of the circumscribed figure.
  • n the number of sample points
  • the stroke dividing unit 312 divides the stroke at the nth sample point when the density of the sample points is equal to or less than the threshold Th (or the density becomes maximum), and generates a substroke.
  • FIG. 20 shows an example in which black circles are input by handwriting as indicated by strokes 801, 802, and 803.
  • strokes 801, 802, and 803 circumscribed rectangles 811, 812, and 813 are set, respectively. Since the circumscribed rectangles 811, 812, and 813 are set with respect to the stroke of the filled portion, the density of the sample points is increased. After that, when the bar portion is handwritten as shown in the stroke 814, the area of the circumscribed rectangle 814 with respect to the stroke 814 increases, so that the sample point density decreases.
  • a stroke 805 representing a quarter note is finally input, a circumscribed rectangle 815 is set and the sample point density becomes the lowest.
  • FIG. 21 is a diagram showing the relationship between the number of sample points of a handwritten stroke and the sample point density. As shown in FIG. 21, the sample point density is greatly lowered by inputting the line portion of the quarter note. As shown in FIG. 22, the stroke dividing unit 312 divides one stroke 805 shown in FIG. 20 into two strokes of sub-strokes 805A and 805B.
  • the circumscribed figure is set sequentially from the last sample point of the stroke data as described above, and the change in the sample density is changed. You may make it investigate and divide a stroke.
  • the stroke dividing unit 312 can divide one stroke into a stroke (surface stroke) of a filled portion and a stroke (line stroke) other than the filled portion.
  • the stroke creation process shown in step B9 of FIG. 8 will be described.
  • the surface stroke determined to be a filled portion is replaced with a line stroke.
  • the circumscribing stroke creation unit 313 sets a circumscribing figure for the surface stroke determined to be a filled portion, and sets the circumscribing figure as a new line stroke.
  • FIG. 23 shows an example of a surface stroke 900 determined as a filled portion.
  • the circumscribed stroke creating unit 313 sets a circumscribed figure 901 for the surface stroke 900 and converts a line representing the circumscribed figure 901 into a line stroke 902.
  • the line stroke 902 is handled in the same manner as other line strokes.
  • the surface stroke 900 is replaced with a stroke corresponding to the circumscribed figure.
  • the figure corresponding to the circumscribed figure can be replaced with a line stroke by thinning the figure.
  • FIG. 24 shows an example of a surface stroke 910 that is determined to be a filled portion.
  • the circumscribing stroke creation unit 313 sets a circumscribed figure 911 for the surface stroke 910 and generates a line segment 912 by thinning the circumscribed figure 901.
  • Line stroke 902 converts line segment 912 into line stroke 913. By using the thinning process in this way, the surface stroke can be replaced with a line stroke.
  • the computer program can be installed and executed on a computer through a computer-readable storage medium storing the computer program. Effects similar to those of the embodiment can be easily realized.
  • the handwriting search processing function of the present embodiment may be realized by a local system in the tablet computer 10, but may be a server system composed of one or more servers.
  • a system configuration in which part of the handwriting search processing function is executed by the tablet computer 10 and the remaining part is executed by one or more servers may be used.
  • the handwritten document processing function of this embodiment can be applied to a normal desktop personal computer.
  • a tablet or the like that is an input device for handwriting input may be connected to the desktop personal computer.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)

Abstract

 実施形態によれば、検索方法は、検索キーである少なくとも1つのストロークを含む第1ストロークを入力し、前記第1ストロークに、第1塗り潰し部分に対応する第2ストロークが含まれる場合に、前記第1ストロークのうち前記第2ストロークを除く第3ストロークを用いて、手書き文書から、検索キーに対応するストロークに関する情報を取得する。

Description

検索方法及び電子機器
 本発明の実施形態は、手書き文書を処理する技術に関する。
 近年、タブレット、PDA、スマートフォンといった種々の電子機器が開発されている。この種の電子機器の多くは、ユーザによる入力操作を容易にするために、タッチスクリーンディスプレイを備えている。
 ユーザは、タッチスクリーンディスプレイ上に表示されるメニューまたはオブジェクトを指などでタッチすることにより、これらメニューまたはオブジェクトに関連づけられた機能の実行を電子機器に指示することができる。また、ユーザは、タッチスクリーンディスプレイ上で、ペンまたは指などで、文字、図形、表などを手書きすることで、複数のストロークが含まれる手書き文書を作成することができる。
特開平09-245122号公報
 多数の手書き文書から必要とする文字列等が含まれる手書き文書を効率良く探し出すためには筆跡検索機能が必要となる。しかし、従来では、所望の手書き文書を効率よく検索するための技術が十分ではない。
 本発明の一形態の目的は、手書き文書を効率よく検索することができる検索方法及び電子機器を提供することである。
 実施形態によれば、検索方法は、検索キーである少なくとも1つのストロークを含む第1ストロークを入力し、前記第1ストロークに、第1塗り潰し部分に対応する第2ストロークが含まれる場合に、前記第1ストロークのうち前記第2ストロークを除く第3ストロークを用いて、手書き文書から、検索キーに対応するストロークに関する情報を取得する。
図1は、実施形態の電子機器の外観を示す例示的な斜視図である。 図2は、実施形態の電子機器と外部装置との連携動作を示す例示的な図である。 図3は、実施形態におけるタッチスクリーンディスプレイ上に手書きされる手書き文書の例を示す図である。 図4は、実施形態における時系列情報の一例を示す図である。 図5は、実施形態における電子機器のシステム構成を示す例示的なブロック図である。 図6は、実施形態の電子機器によって実行される手書き入力アプリケーションプログラムの機能構成を示す例示的なブロック図である。 図7は、実施形態における手書き文書の作成手順の一例について説明するフローチャートである。 図8は、実施形態における塗り潰し判定処理の一例を示すフローチャートである。 図9は、実施形態におけるストローク例を示す図である。 図10は、実施形態におけるストローク例をである。 図11は、実施形態におけるストローク例をである。 図12は、実施形態における複数のストロークにより塗り潰しを表す図形が手書きされる例を示す図である。 図13は、実施形態における塗り潰しを表す図形が手書きされる例を示す図である。 図14は、実施形態における第1の検索処理について示すフローチャートである。 図15は、実施形態における筆跡検索画面の一例を示す図である。 図16は、実施形態におけるクエリストロークの入力例を示す図である。 図17は、実施形態における筆跡検索画面の一例を示す図である。 図18は、実施形態における第2の検索処理について示すフローチャートである。 図19は、実施形態における図検索の処理内容を説明するための図である。 図20は、実施形態におけるストロークが手書き入力される様子を示す図である。 図21は、実施形態における手書きされるストロークのサンプル点数とサンプル点密度との関係を示す図である。 図22は、実施形態におけるストロークの分割を示す図である。 図23は、実施形態における面ストロークの一例を示す図である。 図24は、実施形態における面ストロークの一例を示す図である。
 以下、実施の形態について図面を参照して説明する。 
 図1は、一実施形態に係る電子機器の外観を示す斜視図である。電子機器は、例えば、ペンまたは指によって手書き入力可能な携帯型電子機器である。電子機器は、タブレットコンピュータ、ノートブック型パーソナルコンピュータ、スマートフォン、PDA(personal digital assistant)等として実現され得る。以下では、電子機器がタブレットコンピュータ10として実現されている場合を例にして説明する。タブレットコンピュータ10は、タブレットまたはスレートコンピュータとも称される携帯型電子機器であり、図1に示すように、本体11とタッチスクリーンディスプレイ17とを備える。本体11は、薄い箱形の筐体を有している。タッチスクリーンディスプレイ17は、本体11の上面に重ね合わせるように取り付けられている。
 タッチスクリーンディスプレイ17には、フラットパネルディスプレイと、フラットパネルディスプレイの画面上のペンまたは指の接触位置を検出するように構成されたセンサとが組み込まれている。フラットパネルディスプレイは、例えば、液晶表示装置(LCD)であってもよい。センサとしては、例えば、静電容量方式のタッチパネル、電磁誘導方式のデジタイザなどを使用することができる。以下では、デジタイザとタッチパネルの2種類のセンサの双方がタッチスクリーンディスプレイ17に組み込まれている場合を想定する。
 デジタイザは、例えば、フラットパネルディスプレイの画面の下側に配置される。タッチパネルは、例えば、フラットパネルディスプレイの画面上に配置される。このタッチスクリーンディスプレイ17は、指を使用した画面に対するタッチ操作のみならず、ペン100を使用した画面に対するタッチ操作も検出することができる。ペン100は例えば電磁誘導ペンであってもよい。ユーザは、外部オブジェクト(ペン100又は指)を使用してタッチスクリーンディスプレイ17上で手書き入力操作を行うことができる。手書き入力操作中においては、画面上の外部オブジェクト(ペン100又は指)の動きの軌跡、つまり手書き入力操作によって手書きされるストロークの軌跡(筆跡)がリアルタイムに描画され、これによって各ストロークの軌跡が画面上に表示される。外部オブジェクトが画面に接触されている間の外部オブジェクトの動きの軌跡が1ストロークに相当する。手書きされた文字または図形などに対応する多数のストロークの集合、つまり多数の軌跡(筆跡)の集合が手書き文書を構成する。
 本実施形態では、手書き文書は、イメージデータではなく、各ストロークの軌跡の座標データ列とストローク間の順序関係を示す時系列情報として記憶媒体に保存される。時系列情報の詳細は図4を参照して後述する。時系列情報は、複数のストロークが手書きされた順を示し、且つ複数のストロークにそれぞれ対応する複数のストロークデータを含む。換言すれば、時系列情報は、複数のストロークにそれぞれ対応する時系列のストロークデータの集合を意味する。各ストロークデータは、ある一つのストロークに対応し、このストロークの軌跡上の点それぞれに対応する座標データ系列(時系列座標)を含む。複数のストロークデータの並びの順序は、ストロークそれぞれが手書きされた順序つまり筆順に相当する。
 タブレットコンピュータ10は、記憶媒体から既存の任意の時系列情報(手書き文書)を読み出し、この時系列情報に対応する手書き文書、つまりこの時系列情報によって示される複数のストロークそれぞれに対応する軌跡を画面上に表示することができる。さらに、タブレットコンピュータ10は編集機能を有している。この編集機能は、「消しゴム」ツール、範囲指定ツール、及び他の各種ツール等を用いたユーザによる編集操作に応じて、表示中の手書き文書内の任意のストロークまたは任意の手書き文字等を削除または移動することができる。さらに、この編集機能は、幾つかの手書き操作の履歴を取り消す機能も含んでいる。
 さらに、タブレットコンピュータ10は、筆跡検索(ストローク検索)機能も有している。筆跡検索は、検索キー(クエリストローク)として手書きされる1以上のストローク(クエリストローク)を用いて、クエリストロークに対応する1以上のストロークを任意の手書き文書から検索できればどのようなものであっても良い。筆跡検索は、1以上のクエリストロークに対応する1以上のストロークを含む手書き文書を記憶媒体から検索することもできる。1以上のクエリストロークに対応する1以上のストロークは、例えば、1以上のクエリストロークに類似する1以上のストロークであってもよい。筆跡検索では、例えば、クエリストロークと手書き文書内の複数のストロークそれぞれとの間のマッチング(ストロークマッチング)によって、クエリストロークの特徴量に類似する特徴量を有する1以上のストロークが手書き文書から検索される。検索キー(クエリストローク)として複数のストロークが手書きによって入力される場合には、クエリストローク群内のストローク毎に上述のストロークマッチングが実行される。
 あるストロークの特徴量としては、このストロークの手書き特徴を表すことができる任意の特徴を使用することができる。例えば、特徴量としては、ストロークの形状、ストロークの筆画方向、ストロークの傾斜、等を表す特徴量データを使用しても良い。
 筆跡検索の機能は、ユーザが過去に作成した多数の手書き文書から所望の手書き文書を容易に見つけ出すことを可能にし、またユーザがある手書き文書内から所望の手書き部分を容易に見つけ出すことを可能にする。筆跡検索は、手書き文字だけでなく、手書きの図形、手書きのマーク等を検索することもできる。
 本実施形態では、上述の時系列情報(手書き文書)は、1つまたは複数のページとして管理されうる。この場合、時系列情報(手書き文書)を1つの画面に収まる面積単位で区切ることによって、1つの画面に収まる時系列情報のまとまりを1つのページとして記録してもよい。あるいは、ページのサイズを可変できるようにしてもよい。この場合、ページのサイズは1つの画面のサイズよりも大きい面積に広げることができるので、画面のサイズよりも大きな面積の手書き文書を一つのページとして扱うことができる。1つのページ全体をディスプレイに同時に表示できない場合は、そのページを縮小してするようにしてもよいし、縦横スクロールによってページ内の表示対象部分を移動するようにしてもよい。
 図2は、タブレットコンピュータ10と外部装置との連携動作の例を示している。タブレットコンピュータ10は、パーソナルコンピュータ1やクラウドと連携することができる。すなわち、タブレットコンピュータ10は、無線LANなどの無線通信デバイスを備えており、パーソナルコンピュータ1との無線通信を実行することができる。さらに、タブレットコンピュータ10は、インターネット上のサーバ2との通信を実行することもできる。サーバ2はオンラインストレージサービス、他の各種クラウドコンピューティングサービスを実行するサーバであってもよい。
 パーソナルコンピュータ1はハードディスクドライブ(HDD)のようなストレージデバイスを備えている。タブレットコンピュータ10は、時系列情報(手書き文書)を、ネットワークを通じてパーソナルコンピュータ1に送信して、パーソナルコンピュータ1のHDDに記録することができる(アップロード)。タブレットコンピュータ10とパーソナルコンピュータ1との間のセキュアな通信を確保するために、通信開始時には、パーソナルコンピュータ1がタブレットコンピュータ10を認証するようにしてもよい。この場合、タブレットコンピュータ10の画面上にユーザに対してIDまたはパスワードの入力を促すダイアログを表示してもよいし、タブレットコンピュータ10のIDなどを自動的にタブレットコンピュータ10からパーソナルコンピュータ1に送信してもよい。
 これにより、タブレットコンピュータ10内のストレージの容量が少ない場合でも、タブレットコンピュータ10が多数の時系列情報(手書き文書)あるいは大容量の時系列情報(手書き文書)を扱うことが可能となる。
 さらに、タブレットコンピュータ10は、パーソナルコンピュータ1のHDDに記録されている任意の1以上の手書き文書を読み出し(ダウンロード)、その読み出した手書き文書によって示されるストロークそれぞれの軌跡をタブレットコンピュータ10のディスプレイ17の画面に表示することができる。この場合、複数の手書き文書それぞれのページを縮小することによって得られるサムネイルの一覧をディスプレイ17の画面上に表示してもよいし、これらサムネイルから選ばれた1ページをディスプレイ17の画面上に通常サイズで表示してもよい。
 さらに、タブレットコンピュータ10が通信する先はパーソナルコンピュータ1ではなく、上述したように、ストレージサービスなどを提供するクラウド上のサーバ2であってよい。タブレットコンピュータ10は、手書き文書をネットワーク越しにサーバ2に送信して、サーバ2のストレージデバイス2Aに記録することができる(アップロード)。さらに、タブレットコンピュータ10は、サーバ2のストレージデバイス2Aに記録されている任意の手書き文書を読み出して(ダウンロード)、その手書き文書によって示されるストロークそれぞれの軌跡をタブレットコンピュータ10のディスプレイ17の画面に表示することができる。
 このように、本実施形態では、手書き文書が格納される記憶媒体は、タブレットコンピュータ10内のストレージデバイス、パーソナルコンピュータ1内のストレージデバイス、サーバ2のストレージデバイスの何れであってもよい。
 また、上述の筆跡検索を実行可能な本実施形態のシステムは、タブレットコンピュータ10内で実現されるローカルなシステムであってもよいが、1以上のサーバから構成されるシステム(サーバシステム)であってもよい。この場合、タブレットコンピュータ10は、クエリストローク群をサーバシステムに送信する処理と、検索結果をサーバシステムから受信してタブレットコンピュータ10の画面上に検索結果を表示する処理とを実行可能なクライアント端末として機能してもよい。
 次に、図3及び図4を参照して、ユーザによって手書きされたストローク(文字、マーク、図形、表など)と手書き文書との関係について説明する。図3は、ペン100などを使用してタッチスクリーンディスプレイ17上に手書きされるストロークの例を示している。
 図3では、塗り潰した図形を表すストローク(以下、塗り潰し部分と表記する場合がある)と、「Subject」の文字列を表すストロークが手書きされた例を示している。図3に示す塗り潰し部分のストロークは、例えば上下にストローク方向が繰り返し変更されたストロークと、左右にストローク方向が繰り返し変更されたストロークとが重ね合わされている。2つのストロークが重ね合わされることにより、黒四角の図形が表現されている。
 塗り潰し部分のストロークや文字のストロークは、例えば等時間間隔でリアルタイムにサンプリングされ、時系列座標データが得られる。例えば、最初に入力されたストロークについては、時系列座標データSD11、SD12、…SD1aが取得され、次に入力されたストロークについては、時系列座標データSD21、SD22、…SD2bが得られる。
 図4は、図3の手書きストローク列に対応する時系列情報200を示している。時系列情報200は、複数のストロークデータSD1、SD2、…、SD7を含む。時系列情報200内においては、これらストロークデータSD1、SD2、…、SD7は、筆跡順に、つまり複数のストロークが手書きされた順に時系列に並べている。
 各ストロークデータは、一つのストロークに対応する座標データ系列(時系列座標)、つまり一つのストローク上の複数の点に対応する複数の座標データを含む。各ストロークデータにおいては、複数の座標データはストロークが書かれた順に時系列に並べられている。例えば、図4に示す塗り潰し部分に対応する、最初のストロークに対応するストロークデータSD1は、ストロークの軌跡上の点に対応する座標データ系列(時系列座標)、つまりa個の座標データSD11、SD12、…SD1aを含み、次のストロークに対応するストロークデータSD2は、同様にして、b個の座標データSD21、SD22、…SD2bを含む。手書き文字「S」のに対応するストロークデータSD3は、c個の座標データSD31、SD32、…SD3cを含む。なお、1つのストロークに対応する座標データの数は、等時間間隔でリアルタイムにサンプリングされるので、ストロークが手書きされる時間によって異なる。すなわち、ストロークが手書きされる時間が長いほど、座標データの数は増加する。
 ストロークデータ中の座標データは、ストロークの軌跡上の1点に対応するX座標及びY座標を示す。例えば、座標データSD11は、最初のストロークの始点座標(X11,Y11)を示し、座標データSD1aは、最初のストロークの終点座標(X1a,Y1a)を示す。
 手書き文書は、イメージまたは文字認識結果ではなく、時系列のストロークデータの集合として記憶されるので、手書き文字の言語に依存せずに手書き文字を扱うことができる。よって、本実施形態の手書き文書(時系列情報200)の構造は、使用言語の異なる世界中の様々な国で共通に使用できる。
 また、時系列情報200には、ストロークデータ毎に、ストロークが塗り潰し部分であるか否かを示すラベル201を付加する。ストロークが塗り潰し部分であるか否かは、後述する塗り潰し判定処理によって判定される。塗り潰し判定処理によって、塗り潰し部分のストロークと判定されたストロークには、面ストロークを示すラベル「面」を付加し、塗り潰し部分のストロークではないと判定されたストロークには、線ストロークを示すラベル「線」を付加する。
 また、1つの塗り潰し部分が複数のストロークで表されている場合には、ストローク毎に付加されたラベルをマージして、複数のストロークに対応するラベルを付加することもできる。例えば、図4は、塗り潰し部分を表す2つのストロークに対して、マージしたラベル202(ラベル「面」)を付加した例を示す。
 マージ対象となるストロークは、例えば図4に示すストロークSD1,SD2のように、少なくとも何れか1つが面ストロークであり、それぞれのストロークデータに含まれる座標データの一部が重複するストロークとすることができる。この場合、3つ以上のストロークをマージしてラベル「面」を付加しても良いし、面ストロークと線ストロークの組み合わせをマージしてラベル「面」を付加しても良い。
 また、座標データが重複する複数のストロークをマージするだけでなく、座標データが近接する複数のストロークをマージしても良い。例えば、塗り潰した図形(例えば、黒四角形)を手書きする場合、図形の輪郭線を手書きした後に、輪郭線内を塗り潰すことがある。こうした場合、塗り潰した図形は、輪郭線を表すストロークと、塗り潰し部分に対応するストロークとから構成されるため、輪郭線と塗り潰し部分のストロークをマージしてラベル「面」を付加する。なお、近接するストロークの判別は、例えば2つのストロークの座標データが予め決められた一定距離内(一致している場合を含む)にあり、この一定距離内にある座標データが予め決められた数以上ある場合に、ストロークが近接していると判別する。
 図5は、タブレットコンピュータ10のシステム構成を示す。 
 タブレットコンピュータ10は、図5に示すように、CPU101、システムコントローラ102、主メモリ103、グラフィクスコントローラ104、BIOS-ROM105、不揮発性メモリ106、無線通信デバイス107、エンベデッドコントローラ(EC)108等を備える。
 CPU101は、タブレットコンピュータ10内の各種モジュールの動作を制御するプロセッサである。CPU101は、ストレージデバイスである不揮発性メモリ106から主メモリ103にロードされる各種ソフトウェアを実行する。これらソフトウェアには、オペレーティングシステム(OS)103a、及び各種アプリケーションプログラムが含まれている。アプリケーションプログラムには、手書き入力アプリケーションプログラム103bが含まれている。手書き入力アプリケーションプログラム103bは、上述の手書き文書を作成及び表示する機能、手書き文書を編集する機能、筆跡検索機能、及び認識機能等を有している。
 また、CPU101は、BIOS-ROM105に格納された基本入出力システム(BIOS)も実行する。BIOSは、ハードウェア制御のためのプログラムである。
 システムコントローラ102は、CPU101のローカルバスと各種コンポーネントとの間を接続するデバイスである。システムコントローラ102には、主メモリ103をアクセス制御するメモリコントローラも内蔵されている。また、システムコントローラ102は、シリアルバスなどを介してグラフィクスコントローラ104との通信を実行する機能も有している。
 グラフィクスコントローラ104は、本タブレットコンピュータ10のディスプレイモニタとして使用されるLCD17Aを制御する表示コントローラである。このグラフィクスコントローラ104によって生成される表示信号はLCD17Aに送られる。LCD17Aは、表示信号に基づいて画面イメージを表示する。このLCD17A上にはタッチパネル17B及びデジタイザ17Cが配置されている。タッチパネル17Bは、LCD17Aの画面上で入力を行うための静電容量式のポインティングデバイスである。指が接触される画面上の接触位置及び接触位置の動き等はタッチパネル17Bによって検出される。デジタイザ17CはLCD17Aの画面上で入力を行うための電磁誘導式のポインティングデバイスである。ペン100が接触される画面上の接触位置及び接触位置の動き等はデジタイザ17Cによって検出される。
 無線通信デバイス107は、無線LANまたは3G移動通信などの無線通信を実行するように構成されたデバイスである。EC108は、電力管理のためのエンベデッドコントローラを含むワンチップマイクロコンピュータである。EC108は、ユーザによるパワーボタンの操作に応じて本タブレットコンピュータ10を電源オンまたは電源オフする機能を有している。
 次に、図6を参照して、手書き入力アプリケーションプログラム103bの機能構成について説明する。 
 手書き入力アプリケーションプログラム103bは、ペン軌跡表示処理部301、時系列情報生成部302、編集処理部303、ページ保存処理部304、ページ取得処理部305、手書き文書表示処理部306、クエリストローク入力部307、検索処理部308、塗り潰し判定部309等の機能を備える。
 手書き入力アプリケーションプログラム103bは、タッチスクリーンディスプレイ17を用いて入力されるストロークデータを使用することによって、手書き文書(手書きデータ)の作成、表示、編集等を行う。タッチスクリーンディスプレイ17は、「タッチ」、「移動(スライド)」、「リリース」等のイベントの発生を検出するように構成されている。「タッチ」は、画面上に外部オブジェクトが接触したことを示すイベントである。「移動(スライド)」は、画面上に外部オブジェクトが接触されている間に接触位置が移動されたことを示すイベントである。「リリース」は、画面から外部オブジェクトが離されたことを示すイベントである。
 ペン軌跡表示処理部301及び時系列情報生成部302は、タッチスクリーンディスプレイ17によって発生される「タッチ」または「移動(スライド)」のイベントを受信し、これによって手書き入力操作を検出する。「タッチ」イベントには、接触位置の座標データが含まれている。「移動(スライド)」イベントにも、移動先の接触位置の座標データが含まれている。従って、ペン軌跡表示処理部301及び時系列情報生成部302は、タッチスクリーンディスプレイ17から、接触位置の動きの軌跡に対応する座標データ列を受信することができる。
 ペン軌跡表示処理部301は、タッチスクリーンディスプレイ17から座標データ列を受信し、この座標データ列に基づいて、ペン100等を使用した手書き入力操作によって入力される複数のストロークの軌跡をタッチスクリーンディスプレイ17のLCD17Aの画面に表示する。このペン軌跡表示処理部301により、画面にペン100が接触している間のペン100の軌跡、つまり各ストロークの軌跡がLCD17Aの画面に描かれる。
 時系列情報生成部302は、ユーザにより手書き入力操作がされた場合に、タッチスクリーンディスプレイ17から出力される座標データ列を受信し、この座標データ列に基づいて、ストロークデータ(時系列情報)を生成する。ストロークデータ(時系列情報)は、作業メモリ401に一時保存してもよい。
 ページ保存処理部304は、複数のストロークに対応する複数のストロークデータを記憶媒体402に保存する。記憶媒体402は、上述したように、タブレットコンピュータ10内のストレージデバイス、パーソナルコンピュータ1内のストレージデバイス、サーバ2のストレージデバイスの何れであってもよい。
 ページ取得処理部305は、記憶媒体402に記憶されている手書き文書を読み出す。読み出された手書き文書は手書き文書表示処理部306に送られる。手書き文書表示処理部306は、手書き文書を解析し、この解析結果に基づいて、手書き文書内の複数のストロークデータによって示される複数のストローク(軌跡)を画面に手書きページとして表示する。
 編集処理部303は、現在表示中の手書き文書(手書きページ)を編集するための処理を実行する。すなわち、編集処理部303は、タッチスクリーンディスプレイ17上でユーザによって行われる編集操作に応じて、表示されている複数のストローク内の1以上のストロークを削除または移動等するための編集処理を実行する。さらに、編集処理部303は、編集処理の結果を表示中の手書き文書に反映するためにこの手書き文書を更新する。
 ユーザは、「消しゴム」ツール等を使用して、表示されている複数のストローク内の任意のストロークを削除することができる。また、ユーザは、画面上の任意の部分を丸または四角によって囲むための「範囲指定」ツールを使用して、表示されている手書きページ内の任意の部分を範囲指定することができる。
 塗り潰し判定部309は、時系列情報生成部302により生成されたストロークデータ(時系列情報)に対して塗り潰し判定処理を実行して、ストロークが塗り潰し部分を表すストローク(面ストローク)であるか否かを判定する。塗り潰し判定部309は、各ストロークについての判定結果に応じて、ページ保存処理部304によって記憶媒体402に記憶されたストロークデータ(時系列情報200)に対して、ストロークが塗り潰し部分であるか否かを示すラベル201を付加する。また、塗り潰し判定部309は、筆跡検索のために入力されたクエリストロークに対しても、同様にして塗り潰し判定処理を実行して、塗り潰し部分を表すストロークを判定する。
 クエリストローク入力部307は、検索処理部308による検索処理(筆跡検索)において、検索キーとして使用されるクエリストロークを入力し、クエリストロークを用いた検索処理を検索処理部308に実行させる。クエリストロークとしては、手書き入力アプリケーションプログラム103bによって表示される筆跡検索画面に、ユーザの手書き入力操作によって入力される1以上のストロークを使用することができる。また、ユーザによる手書き入力操作によって、手書きページ内から選択される1以上のストロークを、クエリストロークとして使用することもできる。また、クエリストローク入力部307は、クエリストロークに対する塗り潰し判定部309による判定結果に応じて、クエリストローク中の塗り潰し部分を指定して、検索処理部308により検索処理を実行させる。
 検索処理部308は、筆跡検索を実行するために、ストローク検索部310、図検索部311、ストローク分割部312、及び外接ストローク作成部313を備える。
 ストローク検索部310は、クエリストローク入力部307によって入力されるクエリストロークを使用して筆跡検索を実行する。ストローク検索部310は、塗り潰し判定部309によって線ストロークとして判定されたストロークを対象として、クエリストロークに対応するストローク群を手書き文書から検索する筆跡検索を実行する。例えば、ストローク検索部310は、クエリストロークの特徴量と類似する特徴量を有するストローク群を手書き文書から検索してもよい。クエリストロークは、1以上のストロークを含み、検索される各ストローク群も1以上のストロークを含む。上述したように、各ストロークの特徴量としては、ストロークの形状、ストロークの筆画方向、ストロークの傾斜、等を使用しても良い。
 ストローク間の類似度の計算方法としては、様々な方法を使用することができる。例えばストローク検索部310は、各ストロークをベクトルとして扱って類似度を計算する。この場合、全てのストロークが同じ点の数(サンプル数)を有するように、各ストロークを元のストロークデータに基づいて再サンプリングしてもよい。
 さらに、各ストロークの相対的な位置関係を正規化するために、各ストロークのベクトルを差分ベクトルに変換してもよい。例えば、あるストロークが(x1,y1)、(x2,y2)、(x3,y3)という座標データ列を含む場合、この座標データ列を(0,0)、(x2-x1,y2-y1)、(x3-x1,y3-y1)という座標データ列に変換してもよい。このような変換により全てのストロークを原点から書いたストロークとみなすことができるので、各ストロークが書かれた手書きページ内の位置に関係なく、筆跡検索を行うことが可能となる。なお、座標データ列の変換には、各ストロークの相対的な位置関係を正規化することが可能な任意の変換方法を使用し得る。
 またさらに、各ストロークの大きさを正規化するために、個々のストロークの最大幅または最大高さで個々のストロークのベクトル座標を割ってもよい。
 そして、比較対象のベクトル(差分ベクトル)同士の類似度を計算するために、それら比較対象のベクトル(差分ベクトル)間の内積を比較対象のベクトル(差分ベクトル)間の類似度として算出してもよい。
 また、計算の負荷を軽減するために、手書き文書内の各ストロークの特徴量を表す特徴量データ(特徴量ベクトル)を予め算出し、この特徴量データをデータベースに蓄積しても良い。この場合、ストローク検索部310は、クエリストロークの特徴量を算出し、クエリストロークの特徴量とデータベース内の各ストロークの特徴量データとを使用して、クエリストロークの特徴量に類似する特徴量を有するストローク群を検索することができる。また、計算量を削減するために、特徴量ベクトルの次元を削減するための処理を行っても良い。
 一般には、クエリストロークは1ストロークではなく、複数のストロークを含むストローク列である場合が多い。この場合、クエリストローク群(クエリストローク列)に含まれるストローク毎に、このストロークと手書き文書内の複数のストロークそれぞれとの間の類似度が求められる。そして、クエリストローク列の筆順を考慮して、このクエリストローク列に類似するクエリストローク列が手書き文書から検索される。ストローク列間の類似度の算出においては、DP(Dynamic Programming)マッチングを使用してもよい。
 筆跡検索では、前述したように、ストロークをベクトルとして扱うことによって類似度を計算する。クエリストロークと手書き文書中のストロークとが、それぞれ同じ文字を表す場合には、ストロークをベクトルとして扱って類似度を計算すると高い類似度を示す。これに対して、クエリストロークと手書き文書中のストロークとが、黒丸や黒四角など塗り潰した図形等を表す場合には、見かけ上、同等であったとしても高い類似度を示さない場合が多い。すなわち、塗り潰し部分を手書き入力する場合、その都度、ストロークの長さや向きが異なったり、複数のストロークを組み合わせたりするなど、ストロークが安定しない。このため、見かけ上、同じ塗り潰しを表すストロークであっても、ストロークを示すベクトルが異なるため、高い類似度を示さなくなる。
 このため、本実施形態のストローク検索部310は、塗り潰し判定部309によって面ストロークとして判定されなかったストローク、すなわち線ストロークとして判定されたストロークを対象として、クエリストロークに対応するストローク群を手書き文書から検索する筆跡検索を実行する。ストローク検索部310は、クエリストローク(検索キー)に塗り潰し部分に対応するストロークが含まれる場合に、クエリストロークのうち塗り潰し部分に対応するストロークを除くストロークを用いて、手書き文書から、検索キーに対応するストロークに関する情報を取得することができる。塗り潰し判定部309により塗り潰し部分と判定されたストローク(面ストローク)については、図検索部311により検索処理をすることができる。
 図検索部311は、クエリストローク入力部307によって入力されるクエリストロークを使用して筆跡検索を実行する。図検索部311は、塗り潰し判定部309によって面ストロークとして判定されたストロークを対象として、クエリストロークに対応するストローク群を手書き文書から検索する筆跡検索を実行する。図検索部311は、ストローク検索部310によるストロークをベクトルとして扱い、ストローク間の類似度を算出する方法とは異なる方法により、塗り潰し部分の検索を実行する。
 ストローク分割部312は、手書き文書中のストロークあるいはクエリストロークについて、1つのストロークを塗り潰し部分を表す面ストロークと、面ストローク以外の線ストロークとに分割する。各ストロークを面ストロークと線ストロークとに分割することにより、ストローク検索部310と図検索部311によりそれぞれに対応する検索処理を実行することができる。
 外接ストローク作成部313は、塗り潰し判定部309によって面ストロークとして判定されたストローク、すなわち塗り潰し部分を表すストロークを、外接するストロークに変換する。例えば、黒丸図形を表すストロークを、黒丸図形に外接するストロークに変換する。この場合、外接するストロークは、塗り潰されていない丸図形に置き換えられる。これにより、面ストロークが線ストロークに変換されるため、ストローク検索部310による検索処理が可能となる。
 次に、本実施形態におけるタブレットコンピュータ10の動作について説明する。 
 本実施形態における手書き入力アプリケーションプログラム103bは、筆跡検索のために入力されるクエリストロークに、黒丸や黒四角などの塗り潰し部分を表すストロークが含まれる場合に、この塗り潰し部分について、塗り潰し部分以外のストロークとは異なる処理をすることで、手書き文書を効率よく検索することができるようにする。
 まず、図7に示すフローチャートを参照しながら、実施形態における手書き文書の作成手順の一例について説明する。 
 ユーザがペン100を用いてタッチスクリーンディスプレイ17上で手書き入力操作をすると、ペン軌跡表示処理部301及び時系列情報生成部302は、タッチスクリーンディスプレイ17から、接触位置の動きの軌跡に対応する座標データ列を入力する(ステップA1)。
 ペン軌跡表示処理部301は、タッチスクリーンディスプレイ17から入力する座標データ列に基づいて、手書き入力されたストロークの軌跡をタッチスクリーンディスプレイ17(LCD17A)に表示する。また、時系列情報生成部302は、タッチスクリーンディスプレイ17から入力する座標データ列に基づいて、ストロークデータ(時系列情報)を生成する(ステップA2)。例えば、時系列情報生成部302は、入力する座標データを一定時間間隔でサンプリングして、サンプル点(座標データ)を記録することでベクトルデータに変換する。入力されるストロークデータの例としては、文字、グラフ、図、記号などがある。ページ保存処理部304は、図4に示すように、複数のストロークに対応する複数のストロークデータを、手書き文書(手書きページ)として記憶媒体402に保存する。
 一方、塗り潰し判定部309は、系列情報生成部302により生成されたストロークデータ(時系列情報)に対して塗り潰し判定処理を実行する(ステップA3)。塗り潰し判定処理では、ストロークが塗り潰し部分を表すストローク(面ストローク)であるか否かを判定する。なお、塗り潰し判定処理は、1ストローク分のストロークデータが生成される毎に実行しても良いし、1ページ分など複数のストロークデータについてまとめて実行しても良い。例えば、ユーザによる指示に応じてストロークデータの保存処理をする時に、1ページ分毎に塗り潰し判定処理を実行する。以下では、1ページ毎に塗り潰し判定処理を実行するものとして説明する。
 図8は、実施形態における塗り潰し判定処理の一例を示すフローチャートである。 
 まず、塗り潰し判定部309は、時系列情報生成部302により生成された複数のストロークデータから、判定対象とするストロークデータを選択する(ステップB1)。なお、ステップB2に示すストローク分割処理は、必須の処理ではないので、詳細については後述する。
 次に、塗り潰し判定部309は、ストロークデータをもとに、ストロークに対して外接図形を設定し(ステップB3)、外接図形の面積を算出する(ステップB4)。
 図9に示すストローク例500は、例えば四角形に塗り潰すために入力されたストローク501と、ストローク501に対して設定された外接図形502の例を示している。外接図形502は、ストローク501の外周に沿って、ストローク501から一定の距離に形成する。ストローク501の場合では、ストローク501が閉領域を形成していないため、ストローク501に沿って外接図形を設定した結果、図9に示すように、ストローク501を囲む外接図形502が形成される。
 図10に示すストローク例510は、例えば円形に塗り潰すために入力されたストローク511と、ストローク511に対して設定された外接図形512の例を示している。ストローク511は、閉領域を形成しているため、外周を形成するストロークに沿った外接図形512が設定される。
 図11に示すストローク例520は、一般的な文字等を表すストローク521と、ストローク521に対して設定された外接図形522の例を示している。ストローク例520に示すように、塗り潰し部分を表さないストローク521の場合では、ストローク521に沿った外接図形522が設定される。
 次に、塗り潰し判定部309は、ストロークに対して設定した外接図形の面積が、予め設定された面積に対する第1閾値より大きいかを判別する。第1閾値は、塗り潰しを意図して入力されたストロークであるか、一般の文字や図形を意図して入力されたストロークであるかを、ストロークに対して設定した外接図形の面積をもとに判別するために決められている。
 例えば、図9と図10に示すストローク501,511は、塗り潰しを意図して入力されたストロークである。従って、ストローク501,511に対応する外接図形502,512の面積は、比較的大きくなる。これに対して、図11に示す一般的なストローク521に対して設定された外接図形522の面積は、外接図形502,512と異なり、比較的小さくなる。
 塗り潰し判定部309は、外接図形の面積が第1閾値より大きくない場合(ステップB5、No)、判定対象とするストロークが塗り潰しを表すストロークではないと判定する(ステップB10)。
 一方、塗り潰し判定部309は、外接図形の面積が第1閾値より大きい場合(ステップB5、Yes)、外接図形内のストロークの密度を算出する(ステップB6)。例えば、ストロークデータがサンプル点によるベクトルデータに変換されているため、塗り潰し判定部309は、判別対象とするストロークのサンプル点の個数を数えて、外接図形の面積で割り、単位面積当たりのサンプル点の個数を密度とする。
 次に、塗り潰し判定部309は、ストロークの密度が、予め設定されたストロークの密度に対する第2閾値より大きいかを判別する。第2閾値は、塗り潰しを意図して入力されたストロークであるか、一般の文字や図形を意図して入力されたストロークであるかを、外接図形内のストロークの面積をもとに判別するために決められている。
 塗り潰し判定部309は、ストロークの密度が第2閾値より大きくない場合(ステップB7、No)、判定対象とするストロークが塗り潰しを表すストロークではないと判定する(ステップB10)。 
 一方、塗り潰し判定部309は、ストロークの密度が第2閾値より大きい場合(ステップB7、Yes)、判定対象とするストロークが塗り潰し部分を表すストロークであると判定する(ステップB8)。なお、ステップB9に示すストローク作成処理は、必須の処理ではないので、詳細については後述する。
 塗り潰し判定部309は、全ストロークの判定を終了したか判断し、判定が終了していないストロークデータがあれば(ステップB11、No)、他のストロークデータを判定対象として選択して(ステップB1)、前述と同様の処理を実行する(ステップB2~B11)。全てのストロークについての判定が終了した場合(ステップB11、Yes)、塗り潰し判定部309は、塗り潰し判定処理を終了する。
 なお、前述した説明では、ストローク501,511,521に対して外接図形502,512,522を設定しているが、外接矩形を設定するようにしても良い。例えば、塗り潰し判定部309は、ストロークデータに含まれる座標データ(サンプル点)のx座標とy座標のそれぞれについて最大値と最小値とを求め、外接矩形を設定することができる。
 図9に示すストローク例505には、ストローク501に対して設定した外接矩形503を示している。同様にして、図10に示すストローク例515は、ストローク511に設定した外接矩形513を示し、図11に示すストローク例525は、ストローク521に設定した外接矩形523を示している。
 図11に示す外接矩形523は、第1閾値よりも面積が大きくなるが、ストローク密度が小さくなるため、外接図形522を設定した場合と同様にして、塗り潰し部分を表すストロークではないと判定される。
 ページ保存処理部304は、塗り潰し判定部309による塗り潰し判定処理が終了すると、ストロークデータ(時系列情報200)に対してストロークが塗り潰し部分であるか否かを示すラベル201を付加して、ストロークデータを記憶媒体402に記録する(ステップA4)。すなわち、ページ保存処理部304は、塗り潰し部分のストロークと判定されたストロークには、面ストロークを示すラベル「面」を付加し、塗り潰し部分のストロークではないと判定されたストロークには、線ストロークを示すラベル「線」を付加する(図4参照)。
 さらに、ページ保存処理部304は、ストローク毎のラベル201の他に、塗り潰し部分を表す複数のストロークに対して、マージしたラベル202(ラベル「面」)を付加することができる。例えば、塗り潰し判定部309は、複数のストロークのうち、少なくとも何れか1つが面ストロークであり、それぞれのストロークデータに含まれる座標データの一部が重複する場合に、該当する複数のストロークに対して、マージしたラベルを付加可能であると判定する。ページ保存処理部304は、塗り潰し判定部309による判定結果に応じて、複数のストロークに対して、マージしたラベル「面」を付加する。
 図12は、複数のストロークにより塗り潰しを表す図形が手書きされる例を示している。図12では、2つのストローク530,531が重ね合わされることにより、黒四角の図形を表すストローク532が手書きされている。ストローク530は、上下にストローク方向が繰り返し変更されたパターンを有し、ストローク531は、左右にストローク方向が繰り返し変更されたパターンを有している。
 このように、塗り潰した図形等を作成するために重ね合わされた2つのストローク530,531については、マージしたラベル202を付加する。
 また、図12に示すように、複数の面ストロークが重ね合わされた場合だけでなく、面ストロークと線ストロークとが重ね合わされて手書きされた場合にマージしたラベル202を付加することもできる。
 図13は、線ストロークに相当するストローク540と、面ストロークに相当する複数のストローク541により塗り潰しを表す図形542が手書きされる例を示している。図13では、図形の輪郭線(例えば、星形)が手書きされた後、輪郭線内を塗り潰すように複数のストロークが手書き入力されている。
 塗り潰し判定部309は、ストローク540,541について、2つのストロークの座標データが予め決められた一定距離内(一致している場合を含む)にあり、この一定距離内にある座標データが予め決められた数以上ある場合に、ストローク540,541が塗り潰しを表す図形542を構成すると判定する。ページ保存処理部304は、ストローク540,541に対して、マージしたラベル「面」を付加する。これにより、線ストロークのストローク540についても、面ストロークと同様に扱うことができる。
 次に、本実施形態における第1の検索処理について、図14に示すフローチャートを参照しながら説明する。 
 図15は、手書き入力アプリケーションプログラム103bによってユーザに提示される筆跡検索画面600の一例を示す図である。
 筆跡検索画面600は、検索キー入力領域551、検索ボタン551A、クリアボタン551Bを表示する。検索キー入力領域551は、検索キーとすべきストローク(クエリストローク)を手書きするための入力領域である。検索ボタン551Aは、筆跡検索処理の実行を指示するためのボタンである。クリアボタン551Bは、検索キー入力領域551に手書きされた文字列または図形の削除(クリア)を指示するためのボタンである。
 筆跡検索画面600は、さらに、複数の手書きページサムネイル601を表示してもよい。図15の例においては、9個の手書き文書それぞれに対応する9個の手書きページサムネイル601が表示されている。
 ここでは、図16に示すように、検索キー入力領域551に例えば塗り潰し図形を表すストロークと「Subject」の文字列を表すストロークとがクエリストロークとして入力されている状態で、検索ボタン551A上で行われるジェスチャ(例えばタップジェスチャ等)が検出されたものとする。手書き入力アプリケーションプログラム103bは、クエリストロークに特徴量が類似するストローク群を、例えば9個の手書きページサムネイル601に対応する手書き文書から検索するための筆跡検索を開始する。
 塗り潰し判定部309は、時系列情報生成部302によりクエリストロークのストロークデータが生成されると(ステップC1)、クエリストローク中の各ストロークについて塗り潰し処理を実行し、塗り潰し部分を表す面ストロークと、その他の線ストロークとに判定する(ステップC2)。塗り潰し処理は、前述と同様に実行するものとして詳細な説明を省略する(図8に示すフローチャート参照)。
 クエリストローク入力部307は、クエリストロークデータを入力して、このクエリストロークデータを検索キーとする検索処理を検索処理部308に実行させる。また、クエリストローク入力部307は、塗り潰し判定部309により判定された、クエリストローク中の塗り潰し部分を指定する。
 検索処理部308のストローク検索部310は、クエリストロークに含まれる塗り潰し部分(面ストローク)を除外したストローク(線ストローク)に該当するストローク群、すなわち塗り潰し部分を除外したストロークの特徴量との類似度が予め設定された判定基準より高いストローク群を検索対象とする手書き文書から検索する(ステップC3)。ストロークの検索は、例えば、ストローク単位で、ベクトル同士の類似度を求め、複数のストロークのクエリのためにDPマッチングによりクエリとマッチするストロークを検索すればよい。また、検索処理部308は、手書き文書から検索されたストローク群を筆跡検索画面600において表示する(ステップC5)。なお、図14に示すステップC4の処理については後述する。
 図16に示す筆跡検索画面600には、類似度が判定基準より高いクエリストロークを含む手書き文書の手書きページサムネイルが検索結果として表示される。図16においては、9個の手書きページのうち5個の手書きページからクエリストロークに対応するストローク群が検索された場合について示している。5個の手書きページサムネイルでは、クエリストロークに対応するストローク群を強調表示する。強調表示としては、例えば検索されたストローク群に矩形枠602を付加したり、検索されたストローク群の表示色を他のストロークと異なる色(例えば、赤色)にしたり、ストローク群の表示形態を反転表示などの他の形態にしたりすることができる。
 さらに、筆跡検索画面600から手書きページサムネイルの1つがユーザによって選択された場合、検索処理部308は、図17に示すように、選択された手書きページサムネイル601に対応する手書きページを、通常のサイズで筆跡検索画面600に表示する。図17に示す例では、検索キー入力領域551に入力された文字列「Subject」を表すクエリストロークをもとに検索した結果、ストローク群602A,602B,602Cが検索されたことを示している。ストローク群602A,602Bには、それぞれ左側に塗り潰し部分を表すストローク605A,605B,605Cが存在しているが、この塗り潰し部分を除外して検索が実行される。このため、ストローク605A,605Bの影響を受けずに、文字列「Subject」を表すクエリストロークに該当するストローク群602A,602Bを精度良く検索することができる。また、塗り潰し部分のストロークは、文字等を表すストロークよりも長いことが多いため、ストローク間の類似度計算に要する時間が、文字のストローク間の類似度計算よりも比較的長くなる。しかし、塗り潰し部分のストロークを除外して検索(類似度計算)をすることで、検索処理の速度を向上させることができる。
 なお、前述した検索処理では、クエリストロークに含まれる塗り潰し部分(面ストローク)を除外して検索をしているが、塗り潰し部分(面ストローク)を利用して、検索結果とするストローク群を絞り込むことができる。
 すなわち、ストローク検索部310は、図14に示すステップC3の処理によって検索されたストローク群を対象として、塗り潰し部分のストロークを含めて検索する(ステップC4)。
 例えば、検索キー入力領域551に入力された文字列「Subject」を表すクエリストロークをもとに検索した結果、図17に示すように、ストローク群602A,602B,602Cが検索される。検索キー入力領域551において、塗り潰し部分と判定されたストロークに続いて、検索に使用した「Subject」を表すストロークが存在しているため、ストローク検索部310は、塗り潰し部分が前に存在するストローク群を、ストローク群602A,602B,602Cから選択する。図17に示す例では、ストローク群602A,602Bの前に、それぞれ塗り潰し部分605A,605Bが存在するため、検索結果としてストローク群602A,602Bを選択する。ストローク群602Cは、クエリストローク中の塗り潰し部分を除くストロークにのみ対応するため選択されない。
 このように、クエリストローク中の塗り潰し部分を利用することにより、より精度良く検索処理を実行することができる。また、本実施形態では、塗り潰し部分を表すストロークについて、例えば黒四角あるいは黒丸のように、文字あるいは図形として認識しないので、認識処理に要する処理付加を増大させることなく、塗り潰し部分を利用した検索処理が可能となる。
 次に、本実施形態における第2の検索処理について、図18に示すフローチャートを参照しながら説明する。 
 第1の検索処理では、塗り潰し部分のストロークについては、クエリストロークと手書き文書中のストロークとの類似度を算出していないが、第2の検索処理では、塗り潰し部分のストロークについても、文書中のストロークとの類似関係を示す評価値を算出して検索処理に反映させる。
 図18に示すステップD1,D2の処理は、図14に示すステップC1,C2と同様に実行されるものとして詳細な説明を省略する。 
 ストローク検索部310は、クエリストローク中の塗り潰し部分と判定されないストローク(線ストローク)については、第1の検索処理と同様にして、ストローク検索を実行する。すなわち、手書き文書等の線ストロークを示すラベルが付加されたストロークを対象にして、ストローク検索を行う(ステップD4)。
 一方、図検索部311は、クエリストローク中の塗り潰し部分と判定されたストローク(面ストローク)については、このストロークを図形化して、手書き文書中のストロークとの類似関係を示す評価値を算出する(ステップD5)。以下、この処理を図検索と称する。
 図19は、図検索の処理内容を説明するための図である。図19には、クエリストロークの面ストローク700と、手書き文書中の面ストローク710を示している。図検索部311は、クエリストロークの面ストローク700と、検索対象とする手書き文書中の面ストローク710のそれぞれについて外接正方形701,711をそれぞれ設定し、外接正方形701,711が同じサイズとなるように、面ストローク700,710を拡大あるいは縮小する。図19では、外接正方形701を縮小することにより外接正方形702を求め、外接正方形711を縮小することにより外接正方形702と同じサイズの外接正方形712を求めている。
 次に、図検索部311は、面ストローク700を縮小した面ストローク703と、面ストローク710を拡大した面ストローク713のそれぞれについて外接図形を算出し、この外接図形の内側を完全に塗潰したそれぞれの図形との類似関係を算出する。例えば、図検索部311は、比較する図形どうしを重ね合わせ、重複する部分の面積の大きさの割合をスコアとして評価すればよい。
 図19には、面ストローク703の外接図形に対応する図形715(クエリ図形A)と、面ストローク713の外接図形に対応する図形705(検索対象図形B)とを重ね合わせた状態を示している。図検索部311は、クエリ図形Aの面積をSa、検索対象図形Bの面積をSbとし、クエリ図形Aと検索対象図形Bとを重ね合わせた時の重複部分の面積をSabとしたとき、スコアSをS=2(Sab)/(Sa+Sb)で求める。スコアSが大きいほど、クエリ図形Aと検索対象図形Bとは類似していると評価することができる。このスコアSが、クエリ図形Aで検索したときの検索対象図形Bの一致度になる。もしクエリストローク中に塗り潰し部分が複数ある場合には、図検索部311は、それぞれの塗り潰し部分について前述した処理を繰り返す。
 こうして、クエリストロークに含まれる塗り潰し部分とそれ以外の部分に分けて、ストローク検索(ステップD4)と図検索(ステップD5)とを完了すると、ストローク検索部310は、それぞれの検索結果を併合する(ステップD6)。例えば、ストローク検索部310は、図検索において算出される評価値(スコアS)を、ストローク検索において算出される類似度に換算し、ストローク検索の場合と同様にして、ストロークが記述された順序に従い、DPマッチングを行う。これにより、記憶媒体402に手書き文書中のストロークの内、クエリストロークにマッチするストロークを検索することができる。
 なお、クエリストローク(線ストローク)と手書き文書中のストロークとの類似度は、例えば(-1~+1)の範囲で算出される。同じ形状の同じストローク方向のストローク同士では類似度が+1となり、同じ形状のストローク方向が正反対のストローク同士では類似度が-1となる。図検索では、例えばスコアSが0~+1の範囲で算出される。この場合、図検索のスコアSをストローク検索の類似度0~+1に換算する。
 検索処理部308は、手書き文書から検索されたストローク群を、前述した第1の検索処理と同様にして筆跡検索画面600において表示する(ステップD7)。
 このようにして、第2の検索処理では、クエリストロークとして塗り潰し部分を含むストロークが入力された場合だけでなく、塗り潰し部分のみのストロークが入力された場合であっても、検索処理をすることができる。また、線ストロークと面ストロークとが混在する図形についても検索することができる。例えば、フェルマータマーク、ト音記号、八分音符マークなど、線と点を組み合わせたマークや図形において、点が黒丸の塗り潰しによって手書きされた場合でも検索することができる。
 次に、塗り潰し判定処理の応用例について説明する。 
 まず、図8のステップB2に示すストローク分割処理について説明する。 
 前述した塗り潰し部分の判定処理では、ストローク単位で判定するとしているが、ここでは、1本のストロークに塗り潰し部分とそれ以外の部分が含まれる場合に、塗り潰し部分とそれ以外の部分のサブストロークに分割する。
 ストローク分割部312は、手書き文書の作成時に入力されたストローク、及び検索処理のために入力されたクエリストロークのストロークデータをもとに、サブストロークを生成する。
 図20は、1本のストロークが手書き入力される様子を示している。図20は、四分音符を表すストロークが手書き入力される例を示しており、黒丸部分が先に入力されてから線部分が入力されている。
 ストローク分割部312は、1本のストロークのストロークデータをもとに、サンプル点の最初からある程度大きなn個のサンプル点までを対象として外接図形(計算の簡単のため外接矩形でもよい)を設定し、外接図形内のストロークのサンプル点数と外接図形の面積をもとにサンプル点の密度(ストロークの密度)を求める。密度が閾値Thより大きい時に、さらにn(サンプル点数)を大きくし、密度が下がるまでnを大きくする。ストローク分割部312は、サンプル点の密度が閾値Th以下となる(あるいは密度が最大になる)ときのn個目のサンプル点においてストロークを分割して、サブストロークを生成する。
 例えば、図20では、黒丸部分がストローク801,802,803に示すように手書き入力された例を示している。ストローク801,802,803には、それぞれ外接矩形811,812,813が設定される。外接矩形811,812,813は、塗り潰し部分のストロークに対して設定されているためサンプル点の密度が高くなる。その後、ストローク814に示すように棒部分が手書き入力されると、ストローク814に対する外接矩形814の面積が大きくなるためサンプル点密度が低くなる。最終的に四分音符を表すストローク805が入力されると、外接矩形815が設定されてサンプル点密度が最も低くなる。
 図21は、手書きされるストロークのサンプル点数と、サンプル点密度との関係を示す図である。図21に示すように、四分音符の線部分が入力されることによりサンプル点密度が大きく下がる。ストローク分割部312は、図22に示すように、図20に示す1本のストローク805を、サブストローク805A,805Bの2本のストロークに分割する。
 さらに、線部分のストロークが先に入力されてから黒丸部分が入力された場合に対応するため、ストロークデータの最後のサンプル点から前述のように外接図形を順次設定して、サンプル密度の変化を調べて、ストロークを分割するようにしても良い。
 このようにして、ストローク分割部312によって、1本のストロークを塗り潰し部分のストローク(面ストローク)と、塗り潰し部分以外のストローク(線ストローク)とに分割することができる。サブストロークを他のストロークと同様に扱うことで、1本ストロークで塗り潰し部分とそれ以外の部分が混在する場合であっても、前述と同様の塗り潰し判定処理、第1の検索処理、第2の検索処理を実行することが可能となる。
 次に、図8のステップB9に示すストローク作成処理について説明する。 
 ストローク作成処理では、塗り潰し部分と判定された面ストロークを、線ストロークに置き換える。外接ストローク作成部313は、塗り潰し部分と判定された面ストロークに対して外接図形を設定し、この外接図形を新たな線ストロークとする。
 図23には、塗り潰し部分と判定された面ストローク900の一例を示している。外接ストローク作成部313は、面ストローク900に対して外接図形901を設定し、この外接図形901を表す線を線ストローク902に変換する。線ストローク902は、他の線ストロークと同様にして扱う。
 このようにして、塗り潰し部分のストロークを外接図形に対応するストロークに置き換えることで、例えば黒丸の塗り潰しを表すストロークが白丸を表すストロークに置き換えられ、黒四角の塗り潰しを表すストロークが白四角を表すストロークに置き換えられる。従って、例えばクエリストロークとして白四角を表すストロークが入力された場合に、手書き文書の作成時に入力された黒四角の塗り潰し部分を検索することができる。また、面ストロークを線ストロークに置き換えることで、第2の検索処理において図検索が不要となる。
 なお、図23に示す例では、面ストローク900を外接図形に対応するストロークに置き換えているが、外接図形に相当する図形を細線化することで線ストロークに置き換えることもできる。
 図24には、塗り潰し部分と判定された面ストローク910の一例を示している。外接ストローク作成部313は、面ストローク910に対して外接図形911を設定し、この外接図形901に対して細線化処理することで線分912を生成する。線ストローク902は、線分912を線ストローク913に変換する。このように細線化処理を利用することで、面ストロークを線ストロークに置き換えることができる。
 なお、本実施形態の手書き文書に対する各種処理はコンピュータプログラムによって実現することができるので、このコンピュータプログラムを格納したコンピュータ読み取り可能な記憶媒体を通じてこのコンピュータプログラムをコンピュータにインストールして実行するだけで、本実施形態と同様の効果を容易に実現することができる。
 また、上述したように、本実施形態の筆跡検索処理の機能はタブレットコンピュータ10内のローカルなシステムによって実現しても良いが、1以上のサーバから構成されるサーバシステムであってもよい。あるいは、筆跡検索処理の機能の一部をタブレットコンピュータ10によって実行し、残りの部分を1以上のサーバによって実行するというシステム構成を利用してもよい。
 また、本実施形態では、タブレットコンピュータを使用する場合を例示して説明したが、本実施形態の手書き文書処理機能は、通常のデスクトップパーソナルコンピュータに適用することもできる。この場合、手書き入力のための入力デバイスであるタブレット等をデスクトップパーソナルコンピュータに接続すれば良い。
 本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

Claims (15)

  1.  検索キーである少なくとも1つのストロークを含む第1ストロークを入力し、
     前記第1ストロークに、第1塗り潰し部分に対応する第2ストロークが含まれる場合に、前記第1ストロークのうち前記第2ストロークを除く第3ストロークを用いて、手書き文書から、検索キーに対応するストロークに関する情報を取得する検索方法。
  2.  前記第1ストロークを含む図形の面積と、前記図形内のストロークの密度をもとに、前記第1塗り潰し部分を表すストロークであるか否かを判定する請求項1記載の検索方法。
  3.  前記手書き文書中の前記第3ストロークと第2塗り潰し部分とを含む第4ストロークを、前記第1塗り潰し部分に基づいて検索する請求項1記載の検索方法。
  4.  前記第2ストロークを除外した前記第1ストロークをもとにした第1の検索と、前記第2ストロークとをもとにした第2の検索との結果をもとに、前記第3ストロークを手書き文書から検索する請求項1記載の検索方法。
  5.  前記第2ストロークを図形化して前記第2の検索をする請求項4記載の検索方法。
  6.  前記第1ストロークを、前記第1塗り潰し部分を表す第1サブストロークと、前記第1塗り潰し部分を表さない第2サブストロークに分割する請求項1記載の検索方法。
  7.  前記第1塗り潰し部分を表すストロークを塗り潰し部分を表さないストロークに置き換える請求項1記載の検索方法。
  8.  検索キーである少なくとも1つのストロークを含む第1ストロークを入力する入力手段と、
     前記第1ストロークに、第1塗り潰し部分に対応する第2ストロークが含まれる場合に、前記第1ストロークのうち前記第2ストロークを除く第3ストロークを用いて、手書き文書から、計算キーに対応するストロークに関する情報を取得する取得手段と
    を有する電子機器。
  9.  前記取得手段は、
     前記第2ストロークを除外した前記第1ストロークをもとにした第1の検索手段と、
     前記第2ストロークをもとにした第2の検索手段とを有し、
     前記第1の検索手段と前記第2の検索手段の検索結果をもとに、前記第3ストロークを手書き文書から検索する請求項8記載の電子機器。
  10.  前記第1ストロークを、前記第1塗り潰し部分を表す第1サブストロークと、前記第1塗り潰し部分を表さない第2サブストロークに分割する分割手段をさらに有する請求項8記載の電子機器。
  11.  前記第1塗り潰し部分を表すストロークを塗り潰し部分を表さないストロークに変換する変換手段をさらに有する請求項8記載の電子機器。
  12.  コンピュータを、
     検索キーである少なくとも1つのストロークを含む第1ストロークを入力する入力手段と、
     前記第1ストロークに、第1塗り潰し部分に対応する第2ストロークが含まれる場合に、前記第1ストロークのうち前記第2ストロークを除く第3ストロークを用いて、手書き文書から、計算キーに対応するストロークに関する情報を取得する取得手段として機能させるためのプログラム。
  13.  前記コンピュータを、さらに、
     前記第2ストロークを除外した前記第1ストロークをもとにした第1の検索手段と、
     前記第2ストロークをもとにした第2の検索手段として機能させ、
     前記第1の検索手段と前記第2の検索手段の検索結果をもとに、前記第3ストロークを手書き文書から検索するための請求項12記載のプログラム。
  14.  前記コンピュータを、さらに、
     前記第1ストロークを、前記第1塗り潰し部分を表す第1サブストロークと、前記第1塗り潰し部分を表さない第2サブストロークに分割する分割手段として機能させる請求項12記載のプログラム。
  15.  前記コンピュータを、さらに、
     前記第1塗り潰し部分を表すストロークを塗り潰し部分を表さないストロークに変換する変換手段として機能させる請求項12記載のプログラム。
PCT/JP2013/068741 2013-07-09 2013-07-09 検索方法及び電子機器 WO2015004730A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2013/068741 WO2015004730A1 (ja) 2013-07-09 2013-07-09 検索方法及び電子機器
JP2013541097A JP5666011B1 (ja) 2013-07-09 2013-07-09 方法及び電子機器
US14/252,678 US20150016725A1 (en) 2013-07-09 2014-04-14 Retrieval method and electronic apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/068741 WO2015004730A1 (ja) 2013-07-09 2013-07-09 検索方法及び電子機器

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/252,678 Continuation US20150016725A1 (en) 2013-07-09 2014-04-14 Retrieval method and electronic apparatus

Publications (1)

Publication Number Publication Date
WO2015004730A1 true WO2015004730A1 (ja) 2015-01-15

Family

ID=52277161

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/068741 WO2015004730A1 (ja) 2013-07-09 2013-07-09 検索方法及び電子機器

Country Status (3)

Country Link
US (1) US20150016725A1 (ja)
JP (1) JP5666011B1 (ja)
WO (1) WO2015004730A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10573033B2 (en) * 2017-12-19 2020-02-25 Adobe Inc. Selective editing of brushstrokes in a digital graphical image based on direction

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991424A (ja) * 1995-09-21 1997-04-04 Canon Inc 検索装置及び方法
JPH09245122A (ja) 1996-03-11 1997-09-19 Hitachi Ltd 情報処理装置
JP2004199130A (ja) * 2002-12-16 2004-07-15 Sony Corp 情報視覚化方法、装置、プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0619615A (ja) * 1992-06-29 1994-01-28 Matsushita Electric Ind Co Ltd 手書き文字入力装置
US9465985B2 (en) * 2013-06-09 2016-10-11 Apple Inc. Managing real-time handwriting recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991424A (ja) * 1995-09-21 1997-04-04 Canon Inc 検索装置及び方法
JPH09245122A (ja) 1996-03-11 1997-09-19 Hitachi Ltd 情報処理装置
JP2004199130A (ja) * 2002-12-16 2004-07-15 Sony Corp 情報視覚化方法、装置、プログラム

Also Published As

Publication number Publication date
JPWO2015004730A1 (ja) 2017-02-23
JP5666011B1 (ja) 2015-02-04
US20150016725A1 (en) 2015-01-15

Similar Documents

Publication Publication Date Title
JP5349645B1 (ja) 電子機器および手書き文書処理方法
US9207808B2 (en) Image processing apparatus, image processing method and storage medium
JP5270027B1 (ja) 情報処理装置および手書き文書検索方法
JP5694234B2 (ja) 電子機器、手書き文書表示方法、及び表示プログラム
JP2015162088A (ja) 電子機器、方法及びプログラム
JP5395927B2 (ja) 電子機器および手書き文書検索方法
JP6464504B2 (ja) 電子機器、処理方法およびプログラム
US20150146986A1 (en) Electronic apparatus, method and storage medium
US9025878B2 (en) Electronic apparatus and handwritten document processing method
JP2014215752A (ja) 電子機器および手書きデータ処理方法
WO2014147712A1 (ja) 情報処理装置、情報処理方法及びプログラム
JP2014032632A (ja) 電子機器、方法、およびプログラム
JP5869179B2 (ja) 電子機器および手書き文書処理方法
US9183276B2 (en) Electronic device and method for searching handwritten document
US20140300629A1 (en) Electronic device, handwritten document processing method, and storage medium
JPWO2014192156A1 (ja) 電子機器および処理方法
JP5735126B2 (ja) システムおよび筆跡検索方法
JP5330576B1 (ja) 情報処理装置および筆跡検索方法
JP5666011B1 (ja) 方法及び電子機器
JP6223687B2 (ja) 電子機器および手書き文書検索方法
JP2013239203A (ja) 電子機器、方法、及びプログラム
JP6039066B2 (ja) 電子機器、手書き文書検索方法およびプログラム
US11966515B2 (en) Gesture recognition systems and methods for facilitating touchless user interaction with a user interface of a computer system
JP2015038670A (ja) 電子機器および方法
JP6202997B2 (ja) 電子機器、方法及びプログラム

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2013541097

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2013840145

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13840145

Country of ref document: EP

Kind code of ref document: A1

WD Withdrawal of designations after international publication
NENP Non-entry into the national phase

Ref country code: DE