Fix bindings in ADT pattern matching codegen
[scheme.git] / ast.scm
1 (load "utils.scm")
2
3 (define (ast-type x)
4   (define (builtin? x)
5     (case x
6       ('+ #t)
7       ('- #t)
8       ('* #t)
9       ('! #t)
10       ('= #t)
11       ('bool->int #t)
12       ('print #t)
13       (else #f)))
14   (cond
15    ((list? x)
16     (case (car x)
17       ('if 'if)
18       ('let 'let)
19       ('lambda 'lambda)
20       ('case 'case)
21       ('closure 'closure) ; only available in codegen
22       ('static-string 'static-string) ; only available in codegen
23       ('stack 'stack) ; only available in codegen (tag that value is passed via stack)
24       (else 'app)))
25    ((builtin? x) 'builtin)
26    ((symbol? x) 'var)
27    ((integer? x) 'int-literal)
28    ((boolean? x) 'bool-literal)
29    ((string? x) 'string-literal)))
30
31 (define (ast-traverse f x)
32   (case (ast-type x)
33     ('let `(let ,(map (lambda (x) (list (car x) (f (cadr x))))
34                       (let-bindings x))
35              ,@(map f (let-body x))))
36     ('app (map f x))
37     ('lambda `(lambda ,(lambda-args x) ,(f (lambda-body x))))
38     ('if `(if ,@(map f (cdr x))))
39     ('case `(case ,(f (case-switch x))
40               ,@(map (lambda (x)
41                        (list (car x) (f (cadr x))))
42                      (case-cases x))))
43     ('stack `(stack ,(cadr x) ,(f (caddr x))))
44     (else x)))
45
46 (define (ast-collect f x)
47   (define (inner y) (ast-collect f y))
48   (case (ast-type x)
49     ['let (append (f x)
50                   (flat-map inner (let-bindings x))
51                   (flat-map inner (let-body x)))]
52     ['app (append (f x)
53                   (flat-map inner x))]
54     ['lambda (append (f x)
55                      (inner (lambda-body x)))]
56     ['if (append (f x)
57                  (flat-map inner (cdr x)))]
58     ['case (append (f x)
59                    (inner (case-switch x))
60                    (flat-map inner (map cadr (case-cases x))))]
61     ['stack (append (f x)
62                     (inner (caddr x)))]
63     [else (f x)]))
64
65 (define (ast-find p x)
66   (define (inner y) (ast-find p y))
67   (define (any p x) (fold-left
68                      (lambda (acc y) (if acc #t (p y)))
69                      #f
70                      x))
71   (define (either . fs)
72     (if (null? fs) #f
73         (if (car fs) (car fs)
74             (apply either (cdr fs)))))
75                      
76   (case (ast-type x)
77     ['let (either (p x)
78                   (any inner (let-bindings x))
79                   (any inner (let-body x)))]
80     ['app (either (p x)
81                   (any inner x))]
82     ['lambda (either (p x)
83                      (inner (lambda-body x)))]
84     ['if (either (p x) (any inner (cdr x)))]
85     ['case (either (p x)
86                    (any inner (map cadr (case-cases x)))
87                    (inner (case-switch x)))]
88     ['stack (either (p x) (inner (caddr x)))]
89     [else (p x)]))
90
91 (define let-bindings cadr)
92 (define let-body cddr)
93
94 (define case-switch cadr)
95 (define case-cases cddr)
96
97 ;; (define (verify-cases data-layouts annotated-program)
98
99 ;;   (define allowed-match-ast-types    
100 ;;     '((Int . (int-literal var))
101 ;;       (Bool . (bool-literal var))
102 ;;       (String . (string-literal var))))
103
104 ;;   (define (check-pattern switch-type pat)
105
106 ;;     (define (impossible-match)
107 ;;       (error "Can't pattern match ~a with ~a" switch-type (ann-expr pat)))
108
109 ;;     (if (assoc switch-type data-layouts)
110 ;;      (begin
111 ;;        (let ([sums (cdr (assoc switch-type data-layouts))])
112 ;;          (unless (eqv? (ast-type (ann-expr pat)) 'var) (impossible-match))
113 ;;          (unless (assoc (car (ann-expr pat)) sums) (impossible-match))
114 ;;          (unless 
115 ;;        )
116 ;;        (begin
117 ;;       (unless (assoc switch-type allowed-match-ast-types)
118 ;;         (error #f "Can't pattern match on ~a" switch-type))
119          
120 ;;       (let ([allowed (cdr (assoc switch-type allowed-match-ast-types))])
121 ;;         (unless (assoc (ast-type (ann-expr pat)) allowed) (impossible-match)))))))
122
123   
124 ;;   (let ([expr (ann-expr annotated-program)])
125 ;;     (case (ast-type expr)
126 ;;       ['case
127 ;;        (let* ([switch-type (ann-type (case-switch expr))]
128 ;;               [allowed (cdr (assoc switch-type allowed-match-ast-types))])
129 ;;          (for-each 
130 ;;            []))]))))
131
132
133                                         ; (let ([(foo a b) (foo 123 345)]) a)
134                                         ;   |
135                                         ;   v
136                                         ; (let ([a (foo~0 (foo 123 345)]
137                                         ;       [b (foo~1 (foo 123 345)]) a)
138 (define (expand-pattern-matches program)
139   (define (go x)
140     (define (let-pattern-match binding)
141       (let ([binding-name (car binding)]
142             [body (cadr binding)])
143         (if (eqv? (ast-type binding-name) 'var)
144             (list (list binding-name body))
145             
146             (let* ([sum-name (car binding-name)]
147                    [destructor (lambda (i) (dtor-name sum-name i))]
148                    [products (cdr binding-name)]
149
150                    [data-layouts (program-data-layouts program)]
151
152                    [type (data-tor-type data-layouts sum-name)]
153
154                    [sums (cdr (assoc type data-layouts))]
155                    [sum (assoc sum-name sums)]
156                    
157                    [expected-number (length (cdr sum))])
158
159                                         ; assert that we only do a let pattern match on an ADT with exactly one sum
160               (when (not (= 1 (length sums)))
161                 (error #f (format "Cannot pattern match a ~a in a let since it has ~a possible constructors"
162                                   type
163                                   (length sums))))
164
165                                         ; assert that there is the correct number of bindings
166               (when (not (= (length products)
167                             expected-number))
168                 (error #f (format "Got ~a bindings: expected ~a for ~a"
169                                (length products)
170                                expected-number
171                                binding)))
172               
173               (flat-map (lambda (y i)
174                           (let-pattern-match (list y `(,(destructor i) ,body))))
175                         products
176                         (range 0 (length products)))))))
177
178     (case (ast-type x)
179       ['let `(let ,(flat-map let-pattern-match (let-bindings x))
180                ,@(map go (let-body x)))]
181       [else (ast-traverse go x)]))
182   (program-map-exprs go program))
183
184 (define (lambda? x)
185   (and (list? x) (eq? (car x) 'lambda)))
186
187 (define (statement-type x)
188   (cond
189    [(and (list? x)
190          (eqv? (car x) 'data)) 'data]
191    [(and (list? x)
192          (eqv? (car x) 'define)) 'define]
193    [else 'expr]))
194
195
196                                         ; (A ((foo (Int Bool))
197                                         ;     (bar (Bool)))
198 (define (program-data-layouts program)
199   (map (lambda (x) (cons (car x) (cdr x))) ; convert to assoc list
200        (map cdr (filter (lambda (x) (eqv? (statement-type x) 'data))
201                         program))))
202
203 (define (program-defines program)
204   (filter (lambda (x) (eqv? (statement-type x) 'defines))
205           program))
206
207 (define (program-map-exprs f program)
208   (map (lambda (x)
209          (case (statement-type x)
210            ['expr (f x)]
211            [else x]))
212        program))
213
214 (define (program-body program)
215   ; hack to have multi-expression bodies
216   `(let ()
217      ,@(filter (lambda (x) (eqv? (statement-type x) 'expr))
218                program)))
219
220 (define (data-tor-type data-layouts tor)
221   (let* ([tors (flat-map data-tors data-layouts)]
222          [info (cadr (assoc tor tors))])
223     (car info)))
224
225                                         ; a data tor is either a constructor or destructor for an ADT
226                                         ; data-tors returns constructors and destructors for a data-layout
227                                         ; (data A (foo Int Bool)
228                                         ;         (bar Bool))
229                                         ;        |
230                                         ;        v
231                                         ; (foo   . ((A foo constructor) . (abs Int (abs Bool A))))
232                                         ; (foo~0 . ((A foo 0 Int)       . (abs A Int)))
233                                         ; (foo~1 . ((A foo 1 Bool)      . (abs A Bool)))
234                                         ; (bar   . ((A bar constructor) . (abs Bool A)))
235                                         ; (bar~0 . ((A bar 0 Bool)      . (abs A Bool)))
236                                         ;  ------+-------------------------------------
237                                         ;  tor   | info                 | type
238
239 (define (data-tors data-layout)
240   (define (constructor-type t products)
241     (fold-right (lambda (x acc) `(abs ,x ,acc)) t products))
242
243   (define (destructor ctor-name prod-type part-type index)
244     (let* ([name (dtor-name ctor-name index)]
245            [info (list prod-type ctor-name index part-type)])
246       (cons name (cons info `(abs ,prod-type ,part-type)))))
247   
248   (let ([type-name (car data-layout)]
249         [ctors (cdr data-layout)])
250     (fold-right
251      (lambda (ctor acc)       
252        (let* ([ctor-name (car ctor)]
253               [products (cdr ctor)]
254               
255               [maker (cons ctor-name (cons (list type-name ctor-name 'constructor) (constructor-type type-name products)))]
256               
257               [dtors (map (lambda (t i) (destructor ctor-name type-name t i))
258                           products
259                           (range 0 (length products)))])
260          (cons maker (append dtors acc))))
261      '()
262      ctors)))
263
264                                         ; creates a type environment for a given adt definition
265 (define (data-tors-type-env data-layout)
266   (map (lambda (x) (cons (car x) (cddr x))) (data-tors data-layout)))
267
268 (define (dtor-name ctor-name index)
269   (string->symbol
270    (string-append (symbol->string ctor-name)
271                   "~"
272                   (number->string index))))
273
274 ; for use in normalized form
275 (define lambda-arg caadr)
276 ; for use elsewhere
277 (define lambda-args cadr)
278 (define lambda-body caddr)
279
280 (define (references prog)
281   (ast-collect
282    (lambda (x)
283      (case (ast-type x)
284        ['var (list x)]
285        [else '()]))
286    prog))
287
288 (define (graph bs)
289   (define (go bs orig-bs)
290     (if (null? bs)
291         '(() . ())
292         (let* [(bind (car bs))
293
294                (vert (car bind))
295                (refs (filter ; only count a reference if its a binding
296                       (lambda (x) (assoc x orig-bs))
297                       (references (cdr bind))))
298                (edges (map (lambda (x) (cons vert x))
299                            refs))
300
301                (rest (if (null? (cdr bs))
302                          (cons '() '())
303                          (go (cdr bs) orig-bs)))
304                (total-verts (cons vert (car rest)))
305                (total-edges (append edges (cdr rest)))]
306           (cons total-verts total-edges))))
307   (go bs bs))
308
309 (define (successors graph v)
310   (define (go v E)
311     (if (null? E)
312         '()
313         (if (eqv? v (caar E))
314             (cons (cdar E) (go v (cdr E)))
315             (go v (cdr E)))))
316   (go v (cdr graph)))
317
318                                         ; takes in a graph (pair of vertices, edges)
319                                         ; returns a list of strongly connected components
320
321                                         ; ((x y w) . ((x . y) (x . w) (w . x))
322
323                                         ; =>
324                                         ; .->x->y
325                                         ; |  |
326                                         ; |  v
327                                         ; .--w
328
329                                         ; ((x w) (y))
330
331                                         ; this uses tarjan's algorithm, to get reverse
332                                         ; topological sorting for free
333 (define (sccs graph)
334   
335   (let* ([indices (make-hash-table)]
336          [lowlinks (make-hash-table)]
337          [on-stack (make-hash-table)]
338          [current 0]
339          [stack '()]
340          [result '()])
341
342     (define (index v)
343       (get-hash-table indices v #f))
344     (define (lowlink v)
345       (get-hash-table lowlinks v #f))
346
347     (letrec
348         ([strong-connect
349           (lambda (v)
350             (begin
351               (put-hash-table! indices v current)
352               (put-hash-table! lowlinks v current)
353               (set! current (+ current 1))
354               (push! stack v)
355               (put-hash-table! on-stack v #t)
356
357               (for-each
358                (lambda (w)
359                  (if (not (hashtable-contains? indices w))
360                                         ; successor w has not been visited, recurse
361                      (begin
362                        (strong-connect w)
363                        (put-hash-table! lowlinks
364                                         v
365                                         (min (lowlink v) (lowlink w))))
366                                         ; successor w has been visited
367                      (when (get-hash-table on-stack w #f)
368                        (put-hash-table! lowlinks v (min (lowlink v) (index w))))))
369                (successors graph v))
370
371               (when (= (index v) (lowlink v))
372                 (let ([scc
373                        (let new-scc ()
374                          (let ([w (pop! stack)])
375                            (put-hash-table! on-stack w #f)
376                            (if (eqv? w v)
377                                (list w)
378                                (cons w (new-scc)))))])
379                   (set! result (cons scc result))))))])
380       (for-each
381        (lambda (v)
382          (when (not (hashtable-contains? indices v)) ; v.index == -1
383            (strong-connect v)))
384        (car graph)))
385     result))